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Engineering a Compiler 





“Keith Cooper 和 tinda Torczon 是 顶级 编译 器 研究 大 员 ; 他 们 还 创建 了 若干 艺术 品 般 的 编译 器 。 
本 书 通过 解释 久 经 考验 的 技术 和 新 算法 ， 提 供 编译 器 设计 与 实现 的 实用 方法 ， 成 功 地 融合 了 编译 器 
的 技术 和 艺术 ， 是 构建 现代 编译 器 的 必 读 参考 。” 
一 一 Jim 上 arus， 微 软 研 究 院 





本 书 深入 探索 编译 器 设计 领域 ,涉及 这 个 领域 中 的 各 种 问题 及 解决 方案 。 通过 展示 问题 的 参 
数 和 这 些 参数 对 编译 器 设计 的 影响 ， 阅 述 问题 的 深度 和 可 能 解决 方案 的 广度 。 本 书 介绍 了 实际 设 
计 中 该 如 何 权衡 ， 以 及 那些 微妙 而 高 深 莫 测 的 选择 对 编译 器 的 影响 。 
本 书 特点 
o 集中 研究 编译 器 的 后 端 一 一 反映 了 近 十 几 年 来 研究 和 发 展 的 成 果 。 
o 使 用 扫描 和 分 析 的 成 熟 理论 引入 在 优化 和 代码 生成 中 起 关键 作用 的 概念 。 
e 介绍 数据 流 分 析 、SSA 形 式 和 标量 优化 等 优化 方法 。 
o 传授 代码 生成 中 的 现代 方法 : 指令 筛选 、 指 令 调 度 和 寡 存 器 分 配 。 
o 给 出 程序 设计 语言 中 最 能 解释 这 些 概念 的 实例 。 





Cooper 博 士 ，Rice 大 学 计算 机 科学 系 教授 ， 是 Rice 巨 型 标量 编译 
f| Keith D. Cooper 器 项 目的 负责 人 ， 这 一 项 目 主要 研究 与 现代 计算 机 的 优化 和 代码 
者 ”生成 相关 的 问题 。 他 还 是 Rice 大 学 高 性 能 软件 研究 中 心 。 计 算 机 与 信息 技术 学 院 和 多 媒体 通信 中 心 的 成 员 ， 
他 开设 本 科 生 和 研究 生 的 编译 器 设计 课程 。 


: Torczon 博 士 ，Rice 大 学 计算 机 科学 系 研究 员 ， 曾 参与 Rice 巨 型 标量 
介 Linda Torezon 编译 器 项 目 和 美国 国家 科学 基金 支持 的 下 一 代 软 件 程序 赞助 的 网 格 应 
用 开发 软件 项 目 ， 并 是 主要 研究 员 。 她 还 是 高 性 能 软件 研究 中 心 和 洛斯 阿 莫 斯 计算 机 科学 院 的 执行 主管 。 
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本 书 旨 在 介绍 编译 器 构造 法 中 的 艺术 和 科学 。 用 大 量 素材 向 读者 展示 现实 权衡 的 存在 ， 
展示 这 些 选择 的 影响 可 能 是 微妙 且 深 远 的 。 省 上 略 由 于 商业 、 语 言 和 编译 器 技术 以 及 可 用 工 
具 的 变迁 而 变 得 不 太 重要 的 技术 、C 语 言 对 优化 和 代码 生成 提供 更 深层 次 的 处 理 。 本 书 内 容 
分 为 四 部 分 。 前 端 部 分 介绍 扫描 、 语 法 分 析 、 上 下 文 相关 分 析 的 内 容 ; 基础 结构 部 分 阐述 
中 间 表 示 、 过 程 抽象 、 代 码 形 态 为 主线 的 知识 ， 优 化 部 分 阐述 构建 编译 器 的 中 间 部 分 一 一 
优化 器 所 出 现 的 问题 ， 代 码 生 成 部 分 着 眼 于 代码 生成 中 的 三 个 主要 问题 。 

本 书 内 容 翔 实 ， 文笔 流 畅 ， 适 合作 为 高 等 院 校 计算 机 专业 本 科 生 和 研究 生 编 译 课程 的 
教材 和 参考 书 。 


Keith D. Cooper, Linda Torczon: Engineering a Compiler (ISBN 1-55860-698-X). 
Copyright © 2004 by Elsevier Science (USA). | 

Translation Copyright © 2006 by China Machine Press. 

All rights reserved. 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 各 个 领域 取 
得 了 芍 断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 吾 出 、 独 领 风 唾 。 在 
商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科 
研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 划 了 研究 的 范畴 ， 还 揭 媒 了 学 术 的 源 变 ， 既 遵 
循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 湖 的 推动 下 ， 我国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 益 迫 切 。 这 
对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 上 显得 举足轻重 。 在 我 
国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 发 展 的 几 十 年 间 积 
淀 的 经 典 教 材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 
发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 华 章 公 
司 就 将 工作 重点 放 在 了 迟 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 Prentice Hall, 
Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关系 ， 从 它们 
HABRA AHA FP EH Tanenbaum, Stroustrup, Kernighan, Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 
以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 庚 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 
书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 襄 助 ， 国 内 的 专家 不 仅 提 供 了 中 肯 的 选 题 
指导 ， 还 不 辞 劳 苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 中 国 的 传播 ， 有 的 还 
专程 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 从 书 ” 已 经 出 版 了 近 百 个 品种 ， 这 些 书籍 在 读者 中 树立 
了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 进一步 推广 与 发 展 打下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 步 入 一 
个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 之 下 出 版 三 个 系列 的 计 
算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开辟 出 “经 典 原版 书库 ”; 同时 ， 引 
进 全 美 通 行 的 教学 辅导 书 “Schaum’s Outlines” 系 列 组 成 “全 美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 丛 
书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 们 服务 ， 华 章 公司 聘请 了 中 国 科 学 院 、 北 京 大 学 、 清 华 大 
学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 
西安 交通 大 学 、 中 国人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮 电大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 
大 学 、 湖 北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 的 
著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 的 教学 度 身 
订 造 的 。 其 中 许多 教材 均 已 为 M. I. T., Stanford, U.C. Berkeley, C. M. U. 等 世界 名 牌 大 学 所 采用 。 不 
仅 涵 次 了 程序 设计 、 数 据 结 构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 编 译 原理 、 软 件 工程 、 图 形 学 、 
通信 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设 
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计 者 之 手 、 有 的 历经 三 十 年 而 不 误 、 有 的 已 被 全 世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 
指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 宫殿 中 由 登 堂 而 人 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 图 书 有 了 质 
量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 教 材 的 出 
版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公 司 欢 迎 老 师 和 读者 对 我 们 的 工作 提出 建议 或 给 予 指 正 ， 我 们 的 联 
系 方法 如 下 : 


电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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对 本 书 的 赞誉 


“Keith Cooper 和 Linda Torczon 是 顶级 编译 器 研究 人 员 ， 他 们 还 创建 了 若干 艺术 品 般 的 编译 器 。 这 本 
书 贯 穿 编译 器 理论 和 实践 两 个 领域 ， 解 释 和 久 经 考验 的 技术 和 算法 ， 并 为 编译 器 的 工程 化 和 编译 器 的 构建 
提出 很 多 切实 可 行 的 建议 。《 编 译 器 工程 》 是 对 构建 现代 编译 器 必 不 可 少 的 重要 技术 的 概括 和 展示 。” 


一 一 Jim Larus， 微 软 研究 院 


“本 书 是 对 现代 编译 器 的 理论 、 实 践 和 知识 的 完美 介绍 。Cooper 和 和 Torczon 通 过 编译 和 计算 机 科学 其 
他 领域 之 间 的 优美 的 相互 关联 展示 这 一 课题 的 朴素 乐趣 。 如 果 你 正在 寻找 由 具有 广博 实践 经 验 诠 释 而 成 
的 编译 器 构造 法 的 完整 之 旅 ， 那 么 这 本 书 就 是 你 的 首选 。” 


一 一 Michael D. Smith， 哈 佛 大 学 


“我 很 高 兴 看 到 这 本 关于 现代 编译 器 设计 的 内 容 全 面 的 书 。 作 者 涵盖 了 经 典 的 素材 ， 也 涵盖 了 近 15 年 
间 发 展 起 来 的 重要 技术 ,包括 面向 对 象 语言 的 编译 、 静 态 单一 赋值 、 基 于 区 域 的 寄存 器 分 配 以 及 代码 调度 。 
他 们 的 方法 把 现代 编译 器 依据 的 形式 结构 与 编译 器 的 优秀 工程 化 所 必需 的 实际 观察 完美 地 协调 起 来 。” 


一 一 John Hennessy， 斯 坦 福 大 学 


“Cooper 和 Torczon 做 了 一 项 完美 的 工作 ， 他 们 集成 了 编译 器 构建 理论 和 编译 器 实现 的 实际 问题 。 本 
书 所 涵盖 的 这 一 领域 的 最 新 进展 使 得 它 成 为 向 当今 的 本 科 生 讲授 编译 器 课程 的 理想 教材 或 教学 参考 书 。” 


一 一 Ken Kennedy，Rice 大 学 





译 者 序 - 


经 过 数 十 年 的 科学 研究 和 经 验 积 累 ， 计 算 机 科学 已 经 取得 了 长 足 的 发 展 ， 计 算 机 已 经 普及 并 在 各 个 
方面 得 到 广泛 的 应 用 。 计 算 机 技术 已 不 再 是 极 少数 人 的 专利 ， 它 被 众多 的 科学 家 、 开 发 人 员 以 及 相关 专 
业 的 学 生 和 教师 掌握 ， 成 为 人 类 的 有 力 工具 。 

在 这 样 的 环境 下 , 计算 机 相关 专业 的 教学 也 应 该 做 相应 的 变革 , 以 适应 计算 机 科学 和 技术 的 发 展 。 
一 方面 ,一 些 曾 经 是 关键 性 的 课程 已 不 再 是 必须 掌握 的 ， 一 些 曾 经 高 深 的 技术 已 经 唾 手 可 得 。 另 一 方 
面 ， 学 生 需 要 掌握 许多 新 知识 、 新 技术 ， 而 如 何 取 舍 这 些 新 知识 和 新 技术 成 为 一 个 重要 的 课题 。 在 这 
一 问题 上 ， 本 书 的 作者 给 我 们 提供 了 一 个 非常 重要 的 启示 。 

经 过 20 多 年 的 研究 和 实践 (从 第 一 个 编译 器 的 诞生 到 今天 已 近 半 个 世纪 ) ， 编 译 器 的 前 端 技术 已 经 
基本 成 熟 。 特 别 是 词法 分 析 和 语法 分 析 的 技术 已 经 形成 固定 的 模式 ， 有 ~- 系 列 自动 生成 相关 模块 的 软件 ， 
不 再 需要 手工 编写 词法 分 析 器 和 语法 分 析 器 。 相 反 ， 代 码 生 成 和 代码 优化 日 益 成 为 我 们 关心 的 技术 ， 许 
多 老 技术 需要 我 们 去 运用 、 去 完善 ， 更 多 的 新 技术 需要 我 们 去 掌握 、 去 开拓 。 因 此 ， 为 了 顺应 时 代 的 要 
求 ， 同 时 为 了 学 生 和 专业 人 士 的 各 种 需要 ， 当 代 的 编译 技术 的 教学 应 该 把 重点 放 在 优化 和 代码 生成 上 ， 
应 该 简化 对 编译 器 前 端的 论述 。 这 也 正 是 作者 完成 《编译 器 工程 》 这 本 书 的 首要 动机 。 

本 书 一 改 把 编译 工作 分 解 成 前 端 和 后 端 两 个 主要 部 分 的 惯例 做 法 ， 把 优化 器 作为 介 于 前 端 和 后 端 之 
间 的 第 三 个 阶段 ， 这 样 构成 了 典型 优化 编译 器 的 工作 流程 。 虽 然 计 算 机 的 性 能 越 来 越 高 ， 但 人 们 对 它 的 
期 待 也 越 来 越 高 ， 期 待 的 提高 远 远 超出 了 计算 机 性 能 的 提高 。 因 此 ， 优 化 也 越 来 越 重要 ， 并 且 已 经 成 为 
一 项 必 不 可 少 的 技术 。 

除 对 讲授 内 容 做 了 各 方面 的 权衡 外 ， 作 者 对 本 书 的 组 织 也 非常 讲究 。 现 代 编译 器 技术 错综复杂 ， 不 
存在 完美 的 线性 排列 。 本 书 通 过 四 个 部 分 把 编译 技术 尽量 排列 成 线性 的 顺序 ， 以 便 读者 轻松 学 习 。 在 对 
编译 技术 进行 总 览 之 后 ， 本 书 第 一 部 分 介绍 编译 器 的 前 端 ， 讲 解 扫描 、 语 法 分 析 和 上 下 文 相关 分 析 。 这 
里 强调 自动 化 技术 和 形式 方法 。 第 二 部 分 讲解 编译 器 中 的 基础 结构 ， 包 括 各 种 中 间 表 示 、 过 程 抽象 和 代 
码 形态 。 把 贯穿 这 一 课程 的 一 些 分 散 的 内 容 组 织 在 一 起 ， 使 得 本 书 其 他 部 分 得 以 依照 编译 器 在 编译 时 的 
执行 顺序 进行 阐述 。 第 三 部 分 包括 优化 阶段 ， 展 示 各 种 优化 技术 。 最 后 的 部 分 阑 述 代码 生成 技术 ， 包 括 
指令 筛选 、 指 令 调 度 和 寄存 器 分 配 的 各 种 技术 。 

书 中 类 似 算法 的 比 对 是 一 大 特色 。 通 过 比 对 ， 读 者 可 以 对 类 似 算 法 有 更 加 直观 且 充 分 的 认识 。 另 一 
个 特点 是 作者 把 许多 算法 归 类 为 不 动 点 算法 。 这 一 方面 使 这 些 算法 更 加 清晰 ， 同 时 也 使 读者 了 解 不 动 点 
算法 的 重要 性 ， 对 算法 的 学 习 、 研 究 有 很 大 的 帮助 。 

总 之 ， 顶 级 编译 器 研究 人 员 Keith Cooper 和 Linda Torczon 给 我 们 带 来 了 一 本 新 颖 、 独 到 的 编译 技术 
参考 教材 。 本 书 不 仅 可 作为 大 学 本 科 和 研究 生 的 编译 技术 或 编译 原理 课程 的 教材 ， 也 应 是 计算 机 软件 相 
关 人 员 必 备 的 -一 本 参考 书 。 

最 后 ， 作 为 讲授 编译 原理 的 教师 ， 译 者 经 常 被 学 生 问 道 : 为 什么 要 学 编译 原理 和 编译 技术 ?我 希望 
. 读者 通过 本 书 能 够 理解 编译 技术 中 蕴涵 的 思维 方式 ， 理 解 程序 设计 与 开发 的 思维 方式 ， 理 解 本 书 的 风格 
主题 : 功能、 结构 和 精美 。 

译 者 水 平 有 限 ， 妃 请 读者 不 将 指正 。 





路 


前 


过 去 的 20 年 间 ， 编 译 器 构造 的 实践 活动 发 生 了 翻天 覆 地 的 变化 。 前 端 已 变 成 商品 组 件 ， 它 们 可 以 从 
可 靠 的 供应 商 那里 买 到 ， 或 从 众多 自由 软件 的 系统 改写 而 来 。 与 此 同时 ， 处 理 器 变 得 对 性 能 更 加 敏感 ; 
编译 代码 的 实际 性 能 很 大 程度 上 依赖 于 编译 器 针对 特定 处 理 器 和 系统 特征 进行 优化 的 能 力 。 这 些 变化 影 
响 着 我 们 构建 编译 器 的 方式 ;它们 也 应 该 影响 我 们 教授 编译 器 构造 法 的 方式 。 

今天 ， 编 译 器 的 发 展 主要 致力 于 优化 和 代码 生成 。 编 译 器 团体 的 新 任务 很 可 能 是 把 代码 生成 器 移植 
到 新 的 处 理 器 上 ， 或 修改 优化 多， 而 不 是 工作 于 扫描 器 或 语法 分 析 器 。 为 学 生 进 入 这 一 环境 做 好 准备 是 一 
个 真正 的 挑战 。 成 功 的 编译 器 设计 者 必须 熟知 优化 和 代码 生成 中 当前 最 实用 的 技术 。 他 们 还 必须 具有 理解 
将 出 现 的 新 技术 的 背景 知识 和 洞察 力 。 我 们 撰写 本 书 (EAC, Engineering a Compiler) 的 目标 是 创作 一 本 
教科 书 并 创建 一 门 课程 ， 向 学 生 展示 现代 编译 中 的 重要 问题 ， 并 为 他 们 提供 解决 这 些 问题 的 背景 知识 。 


学 习 编译 器 构造 法 的 动机 


编译 器 构造 法 结合 了 来 自 计 算 机 科学 各 个 领域 的 技术 。 最 简单 地 说 ， 编 译 器 就 是 一 个 大 型 计算 机 程 
序 。 编 译 器 读 取 一 个 源 语言 的 程序 ， 并 为 在 某 个 目标 体系 结构 上 执行 而 翻译 它 。 作 为 翻译 的 一 部 分 ， 编 
译 器 必须 执行 语法 分 析 以 确定 输入 程序 是 否 合法 。 为 了 把 输入 程序 映射 到 目标 计算 机 的 有 限 资源 上 ， 编 
译 器 必须 操纵 若干 不 同 的 名 字 空 间 ， 分 配 若 干 不 同 种 类 的 资源 ， 并 协调 多 个 运行 时 数据 结构 的 行为 。 为 
了 使 输出 程序 有 合理 的 性 能 ， 它 必须 管理 功能 单元 中 的 硬件 等 待 时 间 ， 预 测 执行 流 及 内 存 需求 ， 并 推断 
出 程序 中 的 不 同 机 器 级 操作 的 独立 性 和 相关 性 。 l 

打开 一 个 现代 优化 编译 器 ， 你 将 发 现 揭示 巨大 求解 空间 的 贪 禁 启 发 式 搜 索 ， 识 别 输入 中 的 字 的 确定 
性 有 穷 自动 机 ， 帮 助 推断 程序 行为 的 不 动 点 算法 ， 试 图 推测 表达 式 值 的 简单 定理 证 明 器 和 代数 化 简 器 ， 
把 抽象 计算 映射 到 机 器 级 操作 上 的 模式 匹配 器 ， 用 于 分 析 数 组 下 标的 丢 番 图 (diophantine ) 方程 和 
Pressburger 算 术 的 解 算 器 ， 以 及 诸如 散 列表 、 图 算法 和 稀疏 集合 实现 等 经 典 算法 和 数据 结构 。 
权衡 

我 们 撰写 EAC 这 本 书 的 主要 目标 是 创建 一 本 用 于 编译 器 设计 与 实现 的 入 门 课程 的 教科 书 。EAC 展 示 
了 编译 器 设计 者 需要 面 对 的 诸多 问题 ， 揭 示 出 编译 器 设计 者 解决 这 些 问 题 所 用 到 的 一 些 技术 。EAC 还 提 
供 了 一 系列 构建 现代 编译 器 所 用 的 实用 技术 的 有 效 选择 。 

在 EAC 的 选 村 中， 为 了 清 足 学 生 在 就 业 市 场 的 需要 ， 我 们 有 总 重新 权衡 了 编译 器 构造 法 的 入门 课程 
的 教材 内 容 。 我 们 减少 了 前 端的 内 容 而 增加 了 优化 和 代码 生成 的 内 容 。 在 后 者 的 领域 ，EAC 集 中 讨论 诸 
如 静态 单一 赋值 形式 、 列 表 调 度 以 及 图 着 色 寄存 器 分 配 等 最 实用 的 技术 。 这 些 课题 为 学 生 们 准备 了 他 们 
将 来 在 现代 商业 编译 器 和 科研 编译 器 中 所 能 遇 到 的 算法 。 

本 书 还 包含 高 年 级 学 生 或 专业 人 士 所 需 的 内 容 。 大 多 数 章节 都 有 高 级 话题 一 节 ， 这 一 节 讨论 超出 一 
般 低 年 级 课程 内 容 所 涉及 的 问题 和 技术 。 另 外 ， 第 9 章 和 第 10 章 介绍 比 一 般 低 年 级 课程 所 涉及 的 内 容 更 
深 一 些 的 数据 流 分 析 和 标量 优化 。 把 这 些 内 容 包 含 在 EAC 中 ， 使 得 它 能 够 满足 高 年 级 学 生 或 充满 好 奇 心 
的 学 生 的 需要 ; 而 且 专 业 人 士 也 可 能 在 他 们 实现 某 些 技术 时 发 现 这 些 章 节 很 有 用 。 





IX 


途径 


编译 器 构造 法 是 工程 设计 中 的 一 项 实践 。 编 译 器 设计 者 必须 在 充满 不 同 选择 ， 而 且 每 一 种 选择 都 有 
其 各 自 的 代价 、 优 势 和 复杂 度 的 设计 空间 中 选择 一 条 路 径 。 每 一 个 决策 都 会 对 结果 编译 器 产生 影响 。 最 
终 产品 的 质量 依赖 于 在 这 一 路 径 上 的 每 一 步 明智 的 决策 。 

因此 ， 编 译 器 中 的 诸多 设计 决策 没有 惟一 正确 的 答案 。 即 使 对 于 那些 “著名 的 ”和 “已 解决 的 ” 问 
题 ， 设 计 和 实现 的 细微 差异 都 将 对 编译 器 的 行为 和 编译 器 生成 的 代码 质量 产生 影响 。 对 每 个 决策 都 有 很 
多 需要 考虑 的 问题 。 作 为 一 个 例子 ， 编 译 器 的 中 间 表 示 的 选择 对 编译 器 的 其 余部 分 ， 无 论 是 对 时 间 和 空 
间 的 需求 ， 还 是 可 以 运用 的 算法 的 难 易 程度 都 将 产生 影响 。 然 而 ， 这 些 决策 通常 都 有 不 尽 人 意 之 处 。 第 
5 章 分 析 了 中 间 表 未 的 空间 和 在 做 出 选择 时 应 该 考虑 的 其 他 问题 。 我 们 将 在 本 书 的 若干 地 方 ， 或 是 直接 
或 在 习题 中 间接 地 提 及 这 一 问题 。 

EAC 党 试探 讨 设 计 空间 问题 ， 并 讨论 问题 的 深度 以 及 可 能 的 解决 方案 的 广度 。 它 给 出 解决 这 些 问题 
的 一 些 方法 ， 以 及 使 这 些 解决 方案 有 吸引 力 的 某 些 限制 。 学 生 需 要 理解 问题 和 解决 方案 的 参数 ， 需 要 理 
解 他 们 的 决策 对 编译 器 设计 其 他 方方面面 的 影响 。 只 有 这 样 ， 编 译 器 设计 者 才能 做 出 明智 的 决策 。 


哲学 思想 


这 本 教科 书 揭示 20 多 年 来 我 们 通过 研究 、 教 学 和 实践 而 发 展 起 来 的 关于 如 何 构建 编译 器 的 哲学 思想 。 
例如 ， 中 间 表 示 应 该 展示 对 最 终 代码 至 关 重要 的 细节 ; 这 些 想法 导致 低级 中 间 表 示 的 采用 。 值 应 该 在 寄 
存 器 中 ， 直 到 分 配器 发 现 它 不 能 把 这 些 值 保存 在 那里 为 止 ， 这 种 实践 引发 了 使 用 虚拟 寄存 器 并 只 在 无 法 
园 避 时 才 把 值 存储 于 内 存 中 的 例子 。 它 还 增加 了 编译 器 后 端 中 高 效 算 法 的 重要 性 。 每 一 个 编译 器 都 应 该 
包含 优化 ; 它 简化 编译 器 的 其 他 部 分 。 

EAC 不 同 于 编译 器 构造 法 的 教科 书 普遍 接受 的 约定 。 例 如 ， 在 例子 中 我 们 使 用 若干 种 不 同 的 程序 设计 
语言 。 用 C 语 言 描述 名 字 调用 参数 传递 没有 意义 ， 所 以 我 们 使 用 Algol-60。 用 FORTRAN 语 言 描述 尾 递归 没 
有 意义 ， 所 以 我 们 使 用 Scheme。 这 种 使 用 多 语言 的 方法 是 现实 的 ， 贯 穿 于 读者 的 整个 职业 生涯 ,“ 未 来 的 
语言 ”将 发 生 若干 变化 。9 我 们 用 抽象 级 较 高 的 形式 表示 EAC 中 的 算法 。 我 们 假设 读者 可 以 填充 这 些 细节 ， 
并 处 理 这 些 细节 以 适应 代码 运行 的 特定 环境 。 


本 书 内 容 的 组 织 


在 撰写 EAC 时 ， 我 们 的 首要 目标 是 为 学 生 工作 于 真实 编译 器 而 编写 一 本 教科 书 。 我 们 已 孝 授 了 10 年 
以 上 本 书 中 的 内 容 ， 试 验 了 材料 的 选择 、 深 度 和 顺序 的 安排 。 从 网 站 上 可 获得 的 课程 内 容 展 示 了 我 们 如 
何 改编 并 在 Rice 大 学 教授 学 生 EAC 的 内 容 。 

教授 现代 代码 生成 技术 的 愿望 使 编排 内 容 顺 序 的 问题 变 得 复杂 。 现 代 代码 生成 强烈 依赖 于 诸如 数据 
流 分 析 和 静态 单一 赋值 形式 等 优化 中 的 思想 。 这 种 依赖 关系 暗示 应 在 覆盖 后 端 算法 之 前 教授 优化 。 在 计 
论 代码 生成 的 内 容 之 前 种 盖 优 化 的 内 容 ， 意 味 着 学 生 在 尝试 着 改进 选择 语句 、 循 环 以 及 数组 引用 的 代码 
之 前 是 看 不 到 这 些 代码 的 。 

因为 没有 这 些 内 容 的 完美 的 线性 排列 ， 所 以 EAC 尽 可 能 按 编译 器 在 编译 时 的 执行 顺序 给 出 这 些 内 容 。 
因此 ， 优 化 的 内 容 处 于 前 端 之 后 却 在 后 端 之 前 ， 即 使 代码 形态 的 讨论 是 后 端的 内 容 。 章 节 开篇 的 图 示 起 
到 提示 这 一 顺序 的 作用 。 教 学 实践 时 也 可 以 不 完全 按照 这 一 顺序 。 


O “在 过 去 的 30 年 闻 ，Algol-68、APL、PL/I、Smalltalk、C、Modula-3、C++、Java， 甚 至 是 ADA 都 作为 未 来 
的 语言 一 个 接 一 个 地 涌现 出 来 。 





X 


本 书 内 容 
在 概述 〈 第 1 章 ) 之 后 ， 本 书 内 容 分 为 四 个 部 分 : 
前 端 


第 一 部 分 的 各 章 给 出 扫描 、 语 法 分 析 和 上 下 文 相关 分 析 的 内 容 。 第 2 章 介绍 识别 器 、 有 穷 自动 机 、 
正则 表达 式 以 及 从 正则 表达 式 出 发 自动 构建 扫描 器 的 算法 。 第 3 章 使 用 上 下 文 无 关 文 法 、 自 顶 向 下 递归 
下 降 分 析 器 和 自 底 向 上 表 驱 动 LR(1) 分 析 器 描述 分 析 。 第 4 章 介绍 类 型 系统 ， 这 是 现实 问题 中 因 太 复 杂 而 
无 法 使 用 上 下 文 无 关 文 法 表示 的 一 个 例子 。 接 着 ,我 们 给 出 解决 这 样 的 上 下 文 相关 问题 的 形式 技术 和 专 
门 的 技术 。 

这 些 章节 展示 一 个 进展 。 在 扫描 中 ， 自 动 化 已 经 取代 了 手工 编码 。 在 分 析 中 ， 自 动 化 大 幅度 减少 了 
程序 员 的 工作 量 。 在 上 下 文 相关 分 析 中 ， 自 动 化 没有 取代 专门 的 手工 编码 方法 。 然 而 ， 这 些 专门 的 技术 
模拟 一 种 形式 技术 背后 的 某 些 思 想 ， 这 就 是 属性 文法 的 运用 。 


基础 结构 


第 二 部 分 把 贯穿 这 一 课程 的 一 些 分 散 的 内 容 组 织 起 来 。 它 给 出 在 前 端 生成 中 间 代 码 、 优 化 这 一 代码 
以 及 把 这 一 代码 转换 成 目标 机 器 代码 所 需 的 背景 知识 。 . 

第 5 章 描述 编译 器 使 用 的 各 种 中 间 表 示 ， 包 括 树 、 图 、 线 性 代码 和 符号 表 。 第 6 章 介绍 编译 器 必须 在 
它 所 生成 的 代码 中 实现 的 运行 时 抽象 ， 包 括 过 程 、 名 字 空 间 、 链 接 约定 和 内 存 管理 。 第 7 章 给 出 代码 生 
成 的 前 奏 ， 集 中 讨论 编译 器 为 不 同 的 语言 结构 所 生成 的 代码 形态 ， 而 不 讨论 生成 这 一 代码 的 算法 。 


优化 


第 三 部 分 包括 构建 编译 器 的 中 间 部 分 一 优化 器 所 出 现 的 问题 。 第 8 章 通 过 讨论 在 不 同 作用 域 中 出 
现 的 一 个 问题 ， 引 出 优化 的 问题 和 技术 。 第 9 章 介绍 迭代 数据 流 分 析 ， 并 展示 静态 单一 赋值 形式 的 结构 。 
第 10 章 为 标量 优化 给 出 一 种 基于 效应 的 分 类 法 ， 然 后 使 用 精 选 的 例子 探讨 这 一 分 类 法 。 

这 一 内 容 上 的 划分 说 明 ， 分 析 和 优化 的 全 面 讨论 可 能 超出 了 一 个 学 期 的 课程 ， 但 是 这 样 处 理 使 本 书 
的 内 容 能 够 满足 高 年 级 和 好 奇 心 强 的 学 生 的 需要 。 在 教授 本 书 内 容 时 ， 我 们 在 讲解 第 8 章 之 后 讲解 代码 
生成 。 在 讲解 代码 生成 时 ， 有 必要 的 话 我 们 返回 第 9 章 和 第 10 章 的 特定 部 分 。 我 们 还 使 用 本 书 的 这 一 一 部 
-分 ， 附 加 若干 论文 节选 来 教授 关于 标量 优化 的 进 阶 课程。 


代码 生成 


最 后 一 部 分 着 眼 于 代码 生成 中 的 三 个 主要 问题 ,第 11 章 涵盖 指令 筛选 的 内 容 ， 它 开始 于 树 模式 匹配 ， 
然后 集中 讨论 窥 孔 风格 的 匹配 器 。 第 12 章 研究 指令 调度 ; 它 集 中 讨论 列表 调度 及 其 变形 。 第 13 章 描述 寄 
存 器 分 配 ; 它 给 出 局 部 分 配 和 全 局 分 配 算法 的 较 深 入 的 论述 。EAC 给 出 的 算法 是 学 生 可 能 发 现 的 用 于 现 
代 编 译 器 的 技术 。 

对 于 某 些 学 生 ， 这 些 章节 是 他 们 第 一 次 要 对 NP 完 全 问题 给 出 近似 解 ， 而 不 是 证 明 它 等 价 于 三 可 满 
足 性 问题 。 这 些 章节 强调 最 实用 的 近似 算法 。 练 习 为 学 生 们 提供 在 容易 处 理 的 例子 中 实践 的 机 会 。 


裁剪 的 思想 


编译 器 构造 法 是 一 个 复杂 、 多 层面 的 学 科 。 由 于 编译 器 中 信息 的 持续 流动 ， 对 于 一 个 问题 的 解决 方 
案 的 选择 决定 后 期 各 阶段 的 输入 以 及 这 些 阶 段 改进 代码 的 机 会 。 对 前 端 所 做 的 微小 变动 可 能 隐藏 优化 的 
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机 会 ; 优化 的 结果 对 代码 生成 器 有 直接 的 影响 ( 例如， 改变 对 寄存 器 的 需求 )。 编 译 器 设计 决策 的 复杂 、 
相互 作用 的 属性 是 这 些 内 容 通常 被 作为 本 科 生 顶级 课程 的 理由 之 一 。 

这 些 复杂 关系 也 出 现在 编译 器 构造 法 的 课程 中 。 求 解 技术 反复 出 现在 这 一 课程 中 。 不 动 点 算法 在 扫 
描 器 和 语法 分 析 器 的 构造 中 起 着 至 关 重要 的 作用 。 它 们 是 支持 优化 和 代码 生成 分 析 的 主要 工具 。 在 扫描 
中 出 现 了 有 穷 自动 机 。 它 们 在 LR(1) 表 驱 动 构造 法 以 及 指令 筛选 的 模式 匹配 器 中 起 着 关键 性 的 作用 。 通 
过 强调 这 些 常 用 的 技术 ，EAC 使 学 生 熟 悉 它 们 。 因 此 ， 当 学 生 遇 到 第 8 章 中 的 迭代 数据 流 算法 时 ， 它 只 
是 另外 一 个 不 动 点 算法 ， 因 为 它 已 是 学 生 熟 悉 的 内 容 。 同 样 地 ， 我 们 把 对 第 12 章 和 第 13 章 中 的 局 部 算法 
到 区 域 算法 或 到 全 局 算法 转换 的 讨论 作为 第 8 章 关 于 优化 作用 域 的 补充 。 


组 织 课程 


编译 器 构造 法 课程 在 具体 应 用 的 环境 中 为 教师 和 学 生 提供 揭示 所 有 这 些 问 题 的 机 会 ， 所 有 有 编译 器 
构造 法 课程 知识 背景 的 学 生 都 能 很 好 地 理解 它 的 基本 功能 。 在 某 些 课程 计划 中 ， 编 译 器 构造 法 课程 把 面 
向 实践 项 目的 其 他 课程 的 概念 结合 到 一 起 ， 成 为 高 年 级 学 生 的 顶级 课程 。 这 一 课程 的 学 生 可 以 为 简单 语 
言 编写 完整 的 编译 器 ， 或 者 把 对 一 个 语言 的 新 特性 的 支持 加 到 现存 的 编译 器 中 ， 例 如 加 到 GCC 或 1A-64 
的 ORC 编 译 器 中 。 这 一 课程 可 以 严格 按 本 书 的 组 织 以 线性 顺序 展开 教学 。 | 

如 果 课 程 计 划 中 其 他 课程 为 学 生 提 供 大 项 目的 实践 ， 那 么 教师 可 以 把 编译 器 构造 法 课程 局 限 在 算法 
及 其 实现 上 。 在 这 样 的 课程 中 ， 实 验 可 以 集中 于 真正 难题 的 抽象 实例 ， 诸 如 寄存 器 分 配 和 调度 。 这 一 课 
程 可 以 为 了 满足 实验 的 需要 在 内 容 上 进行 筛选 ， 并 调整 授课 的 顺序 。 例 如 ， 所 有 学 过 汇编 语言 程序 设计 
的 学 生 都 能 够 写 出 直线 代码 的 寄存 器 分 配器 。 我 们 经 常 把 简单 的 寄存 器 分 配器 作为 第 一 个 实验 。 

无 论 是 哪 种 情况 ， 这 一 课程 都 应 该 从 其 他 课程 中 汲取 素材 。 和 它 明显 相关 的 课程 包括 计算 机 组 成 原 
理 和 汇编 语言 程序 设计 、 操 作 系 统 、 计 算 机 体系 结构 、 算 法 以 及 形式 语言 。 尽 管 编译 器 构造 法 与 其 他 课 
程 的 联系 并 不 明显 ， 得 是 它们 并 非 不 重要 。 例 如 ， 第 7 章 所 讨论 的 字符 拷贝 在 包括 网 络 协 议 、 文 件 服 务 器 
以 及 网 络 服务 器 在 内 的 应 用 性 能 中 起 着 重要 的 作用 。 第 2 章 所 开发 的 扫描 技术 在 从 文本 编辑 到 URL 过 滤 等 
方面 均 有 应 用 。 第 13 章 中 的 自 底 向 上 局 部 寄存 器 分 配器 作为 最 优 离线 页 替换 算法 的 兄弟 而 得 到 公认 。 


编译 器 构造 法 中 的 艺术 和 科学 


编译 器 构造 法 这 一 门 学 问 中 既 有 理论 应 用 于 实践 的 令 人 惊叹 的 成 功 故事 ， 又 有 让 我 们 束手无策 的 无 
奈 。 就 其 成 功 的 一 面 ， 我 们 可 以 通过 把 正则 语言 的 理论 运用 到 识别 器 的 自动 构建 中 来 构建 现代 扫描 器 。 
LR 分 析 器 使 用 相同 的 技术 执行 操纵 移入 归 约 分 析 器 的 句柄 识别 。 数 据 流 分 析 (及 其 兄弟 ) 使 用 既 实用 又 
聪明 的 方式 把 格 论 运用 于 程序 的 分 析 。 用 于 代码 生成 的 近似 算法 对 许多 真正 难题 给 出 优秀 的 解决 方案 。 

另 一 方面 ， 编 译 器 构造 法 也 揭 未 了 不 存在 优秀 解决 方案 的 某 些 复杂 问题 。 现 代 超 标量 计算 机 的 编译 
器 后 端 必须 对 两 个 或 多 个 相互 作用 的 NP 完 全 问题 (指令 调度 、 寄 存 器 分 配 以 及 指令 和 数据 放置 ) 近似 求 
解 。 然 而 ， 这 些 NP 完 全 问题 接近 于 诸如 表达 式 的 代数 重组 的 问题 (例如 ， 参 见 图 7-1 )。 表 达 式 的 代数 重 
组 问题 有 上 百 种 解决 方案 ; 使 情况 变 得 更 粳 的 是 ， 理 想 的 解决 方案 依赖 于 编译 器 运用 的 其 他 转换 。 尽 管 
编译 器 尝试 去 解决 这 些 问 题 (或 近似 的 解决 方案 )， 但 是 它 必须 在 合理 的 时 间 内 运行 并 消耗 不 太 多 的 空 
间 。 因 此 ， 现 代 超标 量 计算 机 的 优秀 编译 器 必须 把 理论 、 实 践 知识 、 工 程 学 和 经 验 艺 术 性 地 结合 起 来 。 

在 本 书 中 ， 我 们 尝试 着 传播 编译 器 构造 法 中 的 艺术 和 科学 。EAC 包 含 大 量 的 素材 向 读者 展示 现实 权 
衡 的 存在 ,以 及 展示 这 些 选择 的 影响 可 能 是 微妙 且 深 远 的 。EAC 省 略 那 些 由 于 商业 、 语 言 和 编译 器 技术 ， 
或 者 可 用 工具 的 变迁 而 变 得 不 太 重要 的 技术 。 另 外 ，EAC 对 优化 和 代码 生成 提供 更 深层 次 的 处 理 。 
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关于 原 书 封面 


本 书 的 封面 是 名 画 “ 方 舟 的 登陆 (The Landing of the Ark)” 的 一 部 分 ， 它 装饰 着 Rice 大 学 的 邓肯 
礼堂 (Duncan Hall) 的 天 花 板 (参看 下 面 这 幅 画 ) 。 邓 肯 礼 堂 和 它 的 天 花 板 都 是 由 英国 设计 师 John 
Outram 设 计 的 。 邓 肯 礼 堂 是 Outram 作 为 一 名 设计 者 在 其 职业 生涯 中 所 开拓 的 建筑 学 、 装 潢 学 以 及 哲学 主 
题 的 外 在 表现 。 这 一 礼堂 的 天 花 板 装潢 对 这 一 建筑 物 的 设计 方案 起 着 重要 的 作用 。Outram 把 一 组 寓意 深 
刻 的 造物 神话 铭刻 在 天 花 板 上 。 通 过 用 巨大 、 色 彩 鲜明 的 富 言 画面 表达 他 的 思想 ，Outram 创 造 了 一 个 标 
志 ， 它 告知 所 有 进入 这 一 礼堂 的 参观 者 这 一 建筑 物 的 与 众 不 同 。 

把 这 一 相同 的 标志 用 于 我 们 的 《编译 器 工程 》 一 书 的 封面 ， 旨 在 表示 这 一 著作 所 包含 的 重要 思想 是 
作者 的 学 科 的 核心 。 如 同 Outram 的 建筑 物 一 样 ， 本 书 是 作者 职业 生涯 中 所 发 展 起 来 的 知识 主题 的 问 峰 ; 
如 同 Outram 的 装潢 设计 方案 一 样 ， 本 书 是 交流 思想 的 手段 ; 如 同 Outram 的 天 花 板 一 样 ， 本 书 以 新 方式 呈 
现 重要 的 思想 。 

通过 把 编译 器 的 设计 与 结构 与 这 一 建筑 物 的 设计 和 结构 结合 在 一 起 ， 我 们 意图 展示 这 两 个 不 同 活动 
中 的 很 多 相似 之 处 。 与 Outram 的 长 期 讨论 把 我 们 引入 建筑 的 维特 鲁 威 (Vitruvian) 风格 上 来 : 实用 、 稳 
固 和 喜庆 。 这 些 思想 被 运用 于 很 多 建筑 物 。 编 译 器 结构 也 是 一 样 ， 而 这 正 是 本 书 的 一 贯 主题 : 功能 、 结 
构 和 精美 。 功 能 方面 : 生成 不 正确 代码 的 编译 器 是 无 用 的 。 结 构 
方面 : 工程 的 细节 决定 了 编译 器 的 效率 和 稳健 性 。 精 美方 面 : 设 
计 良 好 的 编译 器 可 以 是 一 件 优美 的 艺术 品 ， 其 中 的 算法 和 数据 结 
构 流畅 地 从 一 个 遍 流 向 另 一 个 遍 。 

我 们 很 荣幸 能 用 John Outram 的 作品 装饰 本 书 的 封面 。 

邓肯 礼堂 的 天 花 板 是 一 个 有 趣 的 技术 艺术 品 。Outram 把 原始 
设计 画 在 一 张 纸 上 。 这 幅 画 被 拍摄 下 来 ， 并 用 1200dpi 扫 描 成 大 约 
750MB 的 数据 。 照 片 被 放大 成 234 个 2 x 8 英尺 9 的 板块 ， 制 作成 
一 张 52 x 72 英 尺 的 图 片 。 使 用 12dpi 的 丙烯 酸 喷 墨 打印 机 把 这 些 板 
块 印 刷 到 一 片 片 穿 孔 乙烯 基 上 。 这 些 穿孔 乙烯 基 被 寝 到 2 x 8 英尺 
的 吸 声 瓦 上 ， 而 吸 声 瓦 被 它 悬 挂 到 拱 顶 的 框架 上 。 
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Martin Rinard, Mark Roberts, Michael Smith 和 Hongwei Xi 4 T HRA. Wilson Hsieh, Jurek 
Jaromezyk, Tevfik Bultan, ChauWen Tseng, Mahmut Kandemir 和 Zhiyuan Li 作为 练习 小 组 和 检查 小 组 的 
成 员 在 课堂 上 试用 了 这 本 书 。 他 们 的 工作 改进 了 这 本 书 ， 使 它 的 风格 和 内 容 得 到 改善 ， 从 而 更 精确 。 

Michael Scott 和 Steve Muchnick 反 复 检查 了 整个 手稿 。 他 们 付出 的 细心 和 耐心 以 及 他 们 提出 的 建议 
都 使 本 书 得 到 极 大 的 改进 。 

Morgan Kaufmann 为 本 书 所 组 建 的 编辑 、 出 版 小 组 的 工作 也 极其 完美 。 由 Denise Penrose 和 Yonie 
Overton 所 领导 的 这 个 小 组 成 员 包 括 John Hammet、Carol Leyba、Rebecca Evans、Steve Rath、Emilia 
Thiuri 和 Lauren Wheelock。Dartmouth 出 版 公司 的 小 组 负责 重新 绘制 本 书 的 播 图 ; 这 些 图 的 布局 是 由 
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1.1 概述 


计算 机 在 日 常生 活 中 的 作用 在 逐年 提高 。 现 代 微 处 理 器 应 用 于 汽车 、 微 波 炉 、 洗 碗 机 、 移 动 电 话 、 
GPS 导航 系统 、 计 算 机 游戏 和 个 人 电脑 等 各 种 设备 。 这 些 计 算 机 运行 用 某 种 “程序 设计 语言 ”编写 的 一 
系列 操作 ， 也 就 是 程序 来 完成 它们 的 工作 。 与 逐步 进化 而 来 且 带 有 歧义 性 的 自然 语言 相 比 ， 程 序 设 计 语 
言 是 一 种 具有 数学 特征 的 、 有 明确 意义 的 形式 语言 。 程 序 设计 语言 是 以 高 表达 能 力 、 简 洁 、 清 晰 为 目的 
而 设计 的 ， 其 目的 是 描述 特定 的 计算 ,记录 执行 特定 的 计算 任务 或 生成 特定 的 计算 结果 的 一 系列 动作 。 

程序 在 执行 之 前 ， 必 须 被 翻译 成 目标 计算 机 上 定义 的 一 系列 操作 。 这 个 翻译 工作 是 由 一 个 被 称 为 纺 
译 器 (compiler) 的 特殊 程序 来 完成 的 。 编 译 器 以 一 个 可 执行 程序 的 描述 作为 输入 ， 以 另外 一 个 等 价 的 
可 执行 程序 的 描述 作为 输出 。 当 然 ， 如 果 它 在 输入 程序 中 发 现 了 错误 ， 那 么 编译 器 将 生成 一 组 适当 的 错 
误 消息 。 把 编译 器 看 成 一 个 黑 盒 子 ， 如 右 图 所 示 。 

通常 ， 编 译 器 接受 的 “ 源 ” 语 言 是 一 种 程序 设计 语言 ， 例 如 
FORTRAN、C、C++、Ada、Java 或 ML 等 。 而 “目标 ”语言 通 
常 是 某 个 计算 机 系统 的 指令 集合 。 

某 些 编译 器 生成 用 成 熟 的 程序 设计 语言 编写 的 目标 程序 ， 而 不 是 用 某 些 计 算 机 的 汇编 语言 编写 的 目 
标 程序 。 这 些 编译 器 生成 的 程序 在 计算 机 上 直接 运行 之 前 还 需要 进一步 翻译 。 很 多 研究 用 的 编译 器 生成 
C 语 言 的 程序 作为 输出 。 因 为 大 多 数 计算 机 都 有 C 语 言 的 编译 器 ， 这 使 目标 程序 在 所 有 这 些 系统 中 都 可 
运行 ， 其 代价 就 是 一 次 额外 的 编译 以 生成 最 终 的 目标 程序 。 以 程序 设计 语言 为 目标 语言 而 不 是 以 计算 机 
的 指令 集合 为 目标 语言 的 编译 器 通常 称 为 源 程序 到 源 程 序 翻译 器 (source-to-source translator), 

可 以 把 很 多 其 他 系统 看 成 编译 器 。 例 如 ， 生 成 PostScript 文 档 的 排版 程序 就 可 以 看 成 是 一 种 编译 器 。 
它 以 对 文档 外 观 的 描述 为 输入 ， 而 输出 一 个 PostScript 文 档 。PostScript 是 描述 图 像 的 一 种 语言 。 因 为 排 
版 程序 以 一 个 可 执行 描述 为 输入 而 且 生 成 另外 一 个 可 执行 描述 ， 因 此 它 是 一 个 编译 器 。 

把 PostScript 转 换 成 像素 的 代码 通常 是 解释 器 (interpreter) 而 不 是 编译 器 。 解 释 器 以 一 个 可 执行 描 
述 为 输入 ， 以 执行 这 一 可 执行 描述 的 结果 为 输出 。 






程序 





解释 器 也 可 用 于 实现 程序 设计 语言 。 对 某 些 语言 ， 例 如 Perl、Scheme 和 APL 来 说 ， 解 释 器 比 编译 器 更 
常用 。 

解释 器 和 编译 器 有 很 多 共同 之 处 。 它 们 执行 很 多 相同 的 任务 。 二 者 都 检查 输入 程序 并 确定 这 个 程序 
是 否 是 一 个 有 效 程序 ; 二 者 都 建立 一 个 内 部 模型 来 刻画 输入 程序 的 结构 和 含义 ; 二 者 都 决定 在 执行 期 间 
值 的 存放 位 置 。 然 而 ， 二 者 的 行为 完全 不 同 : 解释 器 解释 代码 来 生成 结果 ， 而 编译 器 是 释放 通过 运行 来 
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生成 结果 的 翻译 程序 。 本 书 集中 讨论 在 构建 编译 器 中 可 能 遇 到 的 各 种 问题 。 然 而 ， 解 释 器 设计 者 也 可 以 
找到 许多 相关 内 容 。 


1.2 为 什么 研究 编译 器 构造 法 


编译 器 是 一 个 大 型 、 复 杂 的 程序 。 它 通常 包含 成 百 上 千 乃 至 上 百 万 行 代码 。 编 译 器 的 很 多 部 分 具有 
很 复杂 的 相互 作用 。 为 编译 器 的 一 个 部 分 所 做 的 设计 方案 对 它 的 其 他 部 分 会 产生 重要 的 影响 。 因 此 ， 编 
译 器 的 设计 与 实现 是 软件 工程 学 的 一 类 重要 的 实践 。 

一 个 好 的 编译 器 就 是 计算 机 科学 的 一 个 缩影 。 它 实际 运用 大 量 的 技术 , 包括 贪 转 算法 (寄存 器 分 配 )、 
启发 式 搜索 技术 (列表 调度 )、 图 形 算法 ( 死 码 消 除 )、 动 态 规 划 (指令 筛选 )、 有 穷 自动 机 和 下 推 自动 
机 《扫描 和 语法 分 析 ) 以 及 不 动 点 算法 (数据 流 分 析 )。 它 处 理 诸如 动态 分 配 、 同 步 、 命 名 、 局 部 化 、 
存储 器 分 层 管理 和 管道 调度 等 问题 。 很 少 有 软件 系统 为 了 实现 一 个 目标 把 如 此 繁多 而 复杂 的 任务 结合 起 
来 。 科 研 编译 器 的 内 部 结构 为 软件 工程 提供 实践 经 验 ， 而 这 些 实践 经 验 是 很 难 从 那些 小 而 不 太 复 杂 的 系 
统 中 得 到 的 。 

编译 器 是 计算 机 科学 的 核心 活动 的 基础 : 使 用 计算 机 解决 问题 时 我 们 需要 编译 器 。 大 多 数 软件 都 需 
要 被 编译 ; 编译 过 程 的 正确 性 和 结果 代码 的 高 效 性 直接 影响 着 我 们 构建 大 型 系统 的 能 力 。 大 多 数学 生 不 
满足 于 研读 这 些 思 想 ; 这 些 思想 必须 加 以 实现 才能 体现 出 它们 的 价值 。 因 此 学 习 编 译 器 构造 法 是 计算 机 
科学 教育 的 一 个 重要 组 成 部 分 。 

编译 器 构造 的 学 问 中 包含 很 多 成 功 的 故事 。 形 式 语言 理论 已 引发 出 自动 生成 扫描 器 和 语法 分 析 器 的 
工具 。 在 文本 检索 、 网 站 过 滤 、 文 字 处 理 和 命令 语言 解释 器 中 ， 同 样 的 工具 和 技术 也 找到 了 用 武之 地 。 
类 型 检验 和 静态 分 析 运用 了 格 论 和 数论 以 及 其 他 数学 分 支 来 理解 和 改进 这 些 程序 。 代 码 生 成 器 使 用 树 模 
式 匹配 算法 、 分 析 、 动 态 规划 和 文本 匹配 来 实现 指令 筛选 的 自动 化 。 

与 此 同时 ， 编 译 器 构造 的 历史 也 经 历 了 一 段 艰 难 的 历程 。 编 译 含 有 相当 棘手 的 问题 。 设 计 一 种 高 级 、 
通用 的 中 间 表 示 的 尝试 在 复杂 性 的 面前 步履 维 艰 。 这 一 过 程 的 若干 部 分 现在 还 不 能 自动 化 : 至 少 自动 化 
技术 还 没有 取代 手工 编码 。 在 很 多 情况 下 ， 我 们 不 得 不 求助 特殊 的 方法 。 指 令 调 度 的 主导 方法 就 是 带 有 
若干 层次 的 决胜 探索 的 仿 禁 算法 。 虽 然 编译 器 显然 可 以 利用 交换 律 和 结合 律 来 改进 代码 ， 但 是 ， 尝 试 这 
样 做 的 大 多 数 编译 器 只 是 单纯 地 按 某 个 标准 的 顺序 重组 表达 式 。 

为 了 构建 一 个 成 功 的 编译 器 ， 我们 需要 把 算法 、 工 程 学 的 洞察 力 以 及 周密 的 计划 有 机 地 结合 在 一 起 。 
好 的 编译 器 给 出 这 些 棘 手 问题 的 综合 性 的 解答 方案 。 它 们 强调 效率 ， 包 括 实现 编译 器 自身 的 效率 以 及 编 
译 器 所 生成 的 代码 的 效率 。 它 们 拥有 揭示 恰当 细节 的 内 部 数据 结构 和 知识 表示 : 这 些 细节 足以 实现 高 度 
优化 ， 但 又 不 会 使 编译 纠缠 于 细节 。 


1.3 编译 的 基本 原则 


编译 器 是 工程 对 象 ， 是 具有 独特 目标 的 大 型 软件 系统 。 构 建 一 个 编译 器 需要 大 量 的 设计 决策 ， 每 个 设 
计 决策 都 对 最 终 的 编译 器 产生 影响 。 虽 然 编 译 器 的 很 多 设计 决策 可 以 使 用 不 同 的 解决 方案 ， 但 是 有 两 个 基 
本 原则 应 坚持 。 编 译 器 必须 遵守 的 第 一 个 原则 是 不 违背 原 义 〈inviolable )。 


编译 器 必须 保持 被 编译 程序 的 含义 不 变 。 


正确 性 是 程序 设计 中 的 一 个 基础 问题 。 编 译 器 必须 忠实 地 实现 它 的 输入 程序 的 “含义 ”来 保证 其 正 
确 性 。 这 一 原则 是 编译 器 设计 者 与 编译 器 用 户 之 间 的 契约 的 核心 。 如 果 编 译 器 能 够 自由 处 理 输 入 程序 的 
含义 的 话 ， 那 么 又 为 什么 不 能 仅仅 生成 一 个 nop 或 return 昵 ? 如 果 人 允许 错误 翻译 的 话 ， 那 么 我 们 为 什么 
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还 要 花 力气 去 把 它 改正 过 来 呢 ? 
编译 器 必须 遵守 的 第 二 个 原则 是 实用 性 。 


编译 器 必须 用 某 种 明确 的 方式 改进 输入 程序 。 


传统 编译 器 使 它 的 输入 程序 可 以 在 某 个 目标 计算 机 上 直接 运行 来 完成 对 它 的 改进 。 其 他 “编译 器 ” 
却 以 不 同 的 方式 改进 它们 的 输入 程序 。 例 如 ，tpic 是 一 个 读 入 用 图 形 语 言 pic 编 写 的 图 画 描述 ， 并 把 它 
转化 成 BEX 的 一 个 程序 ， 它 的 “改进 ”在 于 葬 兴 具有 更 广泛 的 可 用 性 和 一 般 性 。 某 些 编译 器 生成 的 输出 
程序 与 输入 程序 属于 同一 种 语言 ;我们 称 这 些 编译 器 为 源 程序 到 源 程序 翻译 器 。 一 般 地 ， 这 样 的 系统 重 
写 输入 程序 ， 使 得 当 这 一 程序 最 终 被 翻译 成 某 个 目标 计算 机 的 代码 时 可 以 有 所 改进 。 如 果 一 个 编译 器 不 
能 以 某 种 方式 改进 代码 的 话 ， 那 么 谁 又 会 调用 它 呢 ? 


1.4 编译 器 的 结构 


编译 器 是 一 个 大 型 而 复杂 的 软件 系统 。 编 译 器 社区 从 1955 年 开始 构筑 编译 器 ; 经 过 多 年 的 研究 ， 我 
们 已 经 获得 了 很 多 关于 如 何 构 筑 编译 器 的 经 验 。 初 期 ， 我 们 把 编译 器 描述 成 一 个 能 够 把 源 程 序 翻译 成 目 
标 程序 的 单个 盒子 。 当 然 ， 实 际 的 编译 器 要 比 这 样 的 简单 图 示 复 杂 得 多 。 

正如 这 样 的 单 盒子 模型 所 示 ， 编 译 器 必须 既 能 够 理解 需要 编译 的 源 程序 ， 又 能 够 把 它 的 功能 映射 到 
目标 机 器 上 。 这 两 个 任务 的 不 同性 质 表明 我 们 可 以 进行 分 工 ， 从 而 把 编译 工作 分 解 成 两 个 主要 部 分 : 前 
a (frontend) 和 后 端 (back end)。 其 图 示 如 下 : 





前 端 致力 于 理解 源 语 言 程序 。 而 后 端 致 力 于 把 程序 映射 到 目标 机 器 上 。 这 种 分 解 对 于 编译 器 的 设计 与 实 
现 有 几 个 重要 的 意义 。 

前 端 必须 以 某 种 结构 对 源 程序 的 信息 进行 编码 以 供 后 端 使 用 。 这 一 中 间 表 示 (intermediate 
representation, IR) 成 为 编译 器 所 翻译 的 代码 的 确定 表示 。 在 编译 过 程 中 的 每 一 点 ， 编 译 器 都 有 一 个 确 
定 的 表示 。 事 实 上 , 在 编译 的 进程 中 ， 它 也 许 使 用 若干 不 同 的 IR ， 但 是 在 每 一 点 ， 表 示 将 是 确定 的 IR。 
我 们 把 这 个 确定 的 IR 作 为 编译 器 各 自 独 立 阶 段 间 传递 的 程序 版 本 ， 就 如 同 在 前 面 给 出 的 图 示 中 从 前 端 传 
递 到 后 端的 IR 那 样 。 

在 一 个 两 阶段 编译 器 中 ， 前 端 必须 确保 源 程 序 的 正确 性 ， 而 且 必 须 把 源 代码 映射 到 IR。 而 后 端 必须 
把 这 个 IR 程 序 映 射 到 目标 机 器 的 指令 集 和 有 限 资源 上 。 因 为 后 端 只 加 工 前 端 产 生 的 IR ， 它 可 以 假设 IR 不 
包含 语法 和 语义 错误 。 

编译 器 在 生成 目标 程序 之 前 可 能 要 对 代码 的 IR 形 式 进行 多 遍 处 理 。 这 将 产生 更 好 的 代码 ; 实际 上 ， 
编译 器 可 以 在 它 的 第 一 个 阶段 研究 这 个 代码 并 记录 相关 细节 。 然 后 ， 在 第 二 个 阶段 ， 它 就 能 够 使 用 这 些 
记录 来 改进 翻译 的 质量 。( 这 一 观点 并 不 新 鲜 。 最 初 的 FORTRAN 编 译 器 就 对 代码 进行 了 多 遍 处 理 。) 这 
一 策略 要 求 把 第 一 遍 得 到 的 信息 记录 在 I 以 中 ,使 其 在 第 二 遍 中 可 以 找到 并 使 用 。 

最 后 ， 这 种 两 阶段 结构 可 以 简化 对 编译 器 重新 制定 目标 的 过 程 。 我 们 可 以 设想 对 应 于 单一 的 前 端 构 
造 若干 个 后 端 ,. 从 而 构筑 接受 相同 语言 但 是 以 不 同 的 机 器 为 目标 的 编译 器 。 类 似 地 ， 我 们 能 够 设想 对 不 
同 的 语言 构筑 相同 的 IR 并 使 用 同一 个 后 端 。 以 上 两 种 情形 都 假设 一 个 阴 可 以 服务 于 源 语 言 和 目标 语言 的 


若干 组 合 ; 在 实践 中 ， 特 定语 言 和 特定 目标 机 器 的 细节 通常 都 能 找到 适当 的 IR。 

引入 IR 使 我 们 可 以 在 编译 过 程 中 增加 更 多 的 阶段 。 编 译 器 设计 者 可 以 在 前 端 和 后 端 之 间 插 入 第 三 个 
阶段 。 这 一 中 间 部 分 ， 或 称 优化 器 (optimizer) 以 IR 程 序 作 为 它 的 输入 ， 并 生成 等 价 的 食 程 序 作为 输出 。 
通过 把 IR 作 为 接口 ， 编 译 器 设计 者 能 够 以 最 少 的 变更 将 第 三 个 阶段 插入 到 前 端 和 后 端 之 间 。 这 导致 下 面 
的 编译 器 结构 ， 称 为 三 阶段 编译 器 (three-phase compiler). 


目标 
程序 





优化 器 是 一 个 IR 到 IR 转 换 器 ， 它 以 某 种 方式 改进 IR 程 序 。( 注 意 ， 根 据 1.1 节 的 定义 ， 这 些 转换 器 本 
身 也 是 编译 器 。) 优化 器 可 以 对 IR 进 行 多 遍 处 理 、 分 析 IR 和 重 写 IR。 优 化 器 可 能 是 为 了 使 后 端 生成 较 快 
的 目标 程序 而 重 写 IR， 也 可 能 是 为 了 使 后 端 生 成 较 小 的 目标 程序 而 重 写 IR。 也 许 还 有 其 他 目的 ， 例 如 像 
生成 产生 较 少 页 失效 或 省 电 的 程序 等 。 

从 概念 上 看 ， 这 种 三 阶段 结构 代表 了 典型 的 优化 编译 器 。 在 实践 中 ， 这 些 阶 段 可 以 进一步 分 解 成 一 
系列 的 遍 。 前 端 由 两 遍 或 三 遍 组 成 ， 负 责 处 理 识别 合法 的 源 程序 并 生成 这 一 程序 的 初始 豚 形式 。 中 间 部 
分 包含 完成 各 种 优化 的 若干 遍 。 这 些 遍 的 数量 和 目的 随 着 编译 器 的 不 同 而 不 同 。 后 端 由 若干 遍 组 成 ， 其 
中 的 每 遍 都 生成 一 个 更 加 接近 目标 机 器 指令 集 的 IR 程 序 。 三 个 阶段 和 它们 各 自 的 遍 分 享 一 个 共同 的 底层 
基础 结构 。 这 一 结构 如 图 1-1 所 示 。 








图 1-1 典型 编译 器 的 结构 


在 实践 中 ， 将 编译 器 从 概念 上 分 解 为 前 端 、 中 间 部 分 和 后 端 三 个 阶段 是 有 利 的 。 每 个 阶段 要 处 理 的 
问题 是 不 同 的。 前 端 主要 关心 对 源 程 序 的 理解 并 将 分 析 的 结果 记录 到 IR 形 式 中 。 中 间 部 分 致力 于 改进 IR 
形式 。 后 端 把 转换 后 的 IR 程 序 映射 到 目标 机 器 的 有 限 资源 上 ， 了 映射 的 结果 必须 能 够 有 效 地 利用 目标 机 器 
的 有 限 资 源 。 

在 这 三 个 阶段 中 ， 中 间 部 分 的 描述 最 不 清晰 。 优 化 (optimization) 这 一 术语 意味 着 编译 器 发 现 对 某 
个 问题 的 优化 解 。 优 化 中 所 出 现 的 问题 是 如 此 错综复杂 ， 以 至 于 在 实践 中 我 们 无 法 得 到 最 优 解 。 另 外 ， 
编译 后 的 代码 的 实际 行为 依赖 于 应 用 于 优化 器 中 的 所 有 技术 以 及 它 与 后 端 之 间 的 相互 作用 。 因 此 ， 即 使 
一 种 技术 已 经 被 证 明 是 优化 的 ， 它 与 其 他 技术 间 的 相互 作用 也 可 能 产生 非 优 化 结果 。 所 以 ， 相 对 于 非 优 
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化 编译 器 ， 好 的 优化 编译 器 能 够 提高 代码 的 质量 。 但 它 将 几乎 总 是 无 法 生成 最 优 代 码 。 

中 间 部 分 可 以 是 通过 一 项 或 多 项 优化 来 改进 代码 的 单 遍 结构 , 也 可 以 是 每 个 遍 都 读 写 IR 的 多 凯 结 构 。 
单 遍 结 构 也 许 更 有 效 。 多 遍 结构 的 实现 也 许 更 简单 ， 调 试 起 来 也 更 容易 。 它 更 灵活 ， 可 以 在 不 同 的 情况 
下 使 用 不 同 的 优化 组 合 。 这 两 种 途径 的 选择 依赖 于 对 编译 器 的 创建 和 操作 的 限制 。 


1.5 翻译 综述 
为 了 对 编译 过 程 中 的 任务 有 更 好 的 理解 ， 考 虑 对 于 如 下 表达 式 生成 可 执行 代码 我 们 必须 做 些 什么 ? 
wewx2xxxyxz 
其 中 ，w、x、y 和 z 都 是 变量 ， 一 表示 赋值 ，x 是 乘法 操作 符 。 为 了 了 解 编译 器 必须 发 现 的 事实 和 它 
必须 回答 的 问题 ， 我 们 将 跟踪 编译 器 把 这 样 一 个 简单 的 程序 转化 成 可 执行 代码 的 过 程 。 
1.5.1 理解 输入 
在 编译 we-Wx2 xXxyxz 时 ,第 一 步 是 决定 这 些 字符 是 否 形成 程序 设计 语言 中 的 合法 语句 。 这 一 工 


作 由 编译 器 的 前 端 来 完成 。 它 关系 到 格式 ， 或 称 语法 (syntax) 和 含义 ， 或 称 语义 (semantics). ATE 
这 两 个 方面 都 合法 的 话 ， 编 译 器 就 能 够 继续 进行 翻译 、 优 化 和 代码 生成 。 如 果 程 序 不 合法 的 话 ， 那 么 编 


ES 
本 质 上 ， 关 于 编译 器 的 书籍 是 关于 表 记 法 的 书籍 。 毕 竟 ， 编 译 器 把 一 个 用 一 种 表 记 法 写成 的 程 | 
序 翻译 成 用 另外 一 种 表 记 法 写成 的 等 价 程序 。 在 你 阅读 这 本 书 时 ， 会 遇 到 若干 关于 表 记 法 的 问题 。 


| 在 某 些 情况 下 ， 这 些 问题 将 直接 影响 你 对 本 书 内 容 的 理解 。 


1. 表示 算法 
| 我 们 尽量 保持 算法 的 简洁 性 。 我 们 假设 读者 能 够 提供 实现 细节 ， 所 以 使 用 相对 高 级 的 形式 给 出 | 
算法 。 我 们 使 用 代码 体 斜体 书写 算法 并 采用 缩 进 格式 ， 这 很 有 意义 ， 特 别 是 对 if-then-e1se 结 构 。 
| 一 个 then 或 e15e 之 后 的 缩 进 使 相关 代码 形成 一 个 块 。 对 于 下 面 的 代码 片段 而 言 


if Action [s,word] = “shifts,” then 


push word 
push s, 
word<NextwWord() 
else if> 
| then 和 else 之 间 的 所 有 语句 都 是 1f-then-else 结 构 中 的 then 子 语句 的 部 分 。 当 在 1f-then-else 结 | 
构 的 一 个 子 语句 中 只 包含 一 个 语句 时， 我 们 把 关键 字 then 或 e1se 与 子 语句 写 在 同一 行 上 。 
2. 编写 代码 | | 
在 某 些 例子 中 ， 为 了 展示 特定 的 观点 ， 我 们 给 出 某 个 特定 语言 的 实际 程序 。 我 们 用 代码 体 书写 | 
实际 程序 。 
3. 算术 操作 符 
最 后 ， 除 了 在 实际 程序 之 外 ,我们 握 弃 传统 的 用 * 表 示 x 和 用 /表示 :的 用 法 。 对 读者 来 说 含义 
应 该 是 清晰 的 。 
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1. 检测 语法 

为 了 检测 输入 程序 的 语法 ， 编 译 器 必须 把 这 一 程序 的 结构 和 语言 的 定义 对 照 比 较 。 这 需要 有 一 个 适 
当 的 形式 定义 、 一 个 测试 输入 是 否 符合 定义 的 有 效 机 制 以 及 一 个 如 何 处 理 不 合法 输入 的 方案 。 

从 数学 的 角度 看 ， 源 语言 是 一 个 集合 ， 通 常 是 由 有 限 个 规则 定义 的 符号 串 的 无 穷 集合 。 这 样 的 规则 
的 有 限 集 合 称 为 文法 (grammar)。 在 编译 器 的 前 端 ， 实 际 上 是 扫描 器 和 语法 分 析 器 确定 输入 程序 是 否 是 
合法 串 的 集合 中 的 元 素 。 在 这 里 ， 我 们 面临 的 工程 学 挑战 是 如 何 高 效 地 进行 成 员 测试 。 

程序 设计 语言 的 文法 通常 把 词性 称 为 字 或 语法 范畴 。 基 于 构筑 在 词性 上 的 文法 规则 使 得 一 个 规则 可 
以 描述 很 多 句子 。 例 如 ， 在 英语 中 ， 很 多 句子 有 如 下 形式 


Sentence 一 Subject verb Object endmark 


其 中 ，verb 和 endmark 是 词性 ， 而 Sentence、Subject 和 Objcet 是 语法 变量 。Sentence 代 表 由 这 一 规则 所 描 
述 的 形式 的 任意 串 。 符 号 “一 ” 读 做 “派生 ”， 表 示 右 部 的 实例 可 以 抽象 成 为 左 部 的 语法 变量 。 

为 了 运用 这 一 规则 ， 用 户 必 须 把 字 映 射 到 词性 。 例 如 ，verb 代 表 英 语 的 所 有 动词 的 集合 ，endmark 
代表 所 有 表示 句子 结束 的 标点 符号 ， 例 如 名 号、 问号 或 惊叹 号 。 对 于 英语 ， 读 者 一 般 都 能 认识 几 千 个 单 
词 并 且 知 道 它们 所 代表 的 词性 。 对 于 不 熟悉 的 单词 ， 读 者 可 以 查 字 典 。 因 此 ， 本 例 的 语法 是 由 一 个 规则 
集合 或 文法 以 及 一 个 查找 单词 并 把 它们 归 类 成 相应 语法 范畴 的 系统 组 成 的 。 

这 一 基于 描述 定义 语法 的 方法 是 编译 的 关键 。 我 们 不 能 构筑 一 个 含有 规则 的 无 穷 集 合 或 句子 的 无 穷 
集合 的 前 端 。 取 而 代 之 ， 我 们 需要 用 规则 的 有 限 集合 来 生成 或 描述 语言 中 的 句子 。 正 如 我 们 将 在 第 2 章 
和 第 3 章 看 到 的 那样 ， 文 法 的 有 限 性 对 语言 的 表达 能 力 没有 约束 。 

为 了 弄 清楚 “Compilers are engineered objects.” 是 否 是 英语 中 的 一 个 合法 句子 ,我 们 首先 要 查 字典 
来 判定 每 个 单词 都 是 英文 单词 。 其 次 ， 用 每 个 单词 的 文法 范畴 取代 这 个 单词 来 生成 这 个 句子 的 更 抽象 的 
表示 。 


noun verb adjective noun endmark 


最 后 ， 我 们 设法 把 这 个 抽象 了 的 单词 序列 填 入 英语 句子 的 规则 中 。 已 知 英语 文法 可 能 包括 下 面 规则 : 


Sentence — Subject verb Object endmark 
Subject + noun 
Subject — Modifier noun 
Object — noun 
Object — Modifier noun 
—+ adjective 


Modifier 


通过 观察 ， 我 们 可 以 发 现 这 个 例句 的 如 下 派生 (derivation): 
规则 | 名 型 


= Sentence 
1 Subject verb Object endmark 

2 noun verb Object endmark 

3 | noun verb Modifier noun endmark 

6 noun verb adjective noun endmark 


这 一 派生 始 于 语法 变量 Sentence。 在 每 一 步 ， 它 重 写 句 型 中 的 一 项 ,使 用 左 部 为 这 个 项 的 适当 规则 的 右 
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部 替换 这 个 项 。 第 一 步 使 用 规则 1 的 右 部 来 替换 Sentenrce。 第 二 步 使 用 规则 2 的 右 部 替换 Sxbjecr。 第 三 步 
使 用 规则 5 的 右 部 替换 Object:， 最 后 一 步 根据 规则 6 使 用 adjective 重 写 Modifier。 此 时 ， 派 生生 成 的 名 型 
与 输入 句子 的 抽象 表示 相 匹 配 。 

这 一 派生 证 明 “Compilers are engineered objects.” 属 于 由 规则 1 到 规则 6 所 描述 的 语言 。 发 现 字符 串 
的 字 并 根据 它们 的 词性 分 类 的 过 程 称 为 扫描 (scanning )。 发 现 一 个 已 分 类 的 字 流 是 否 在 某 个 文法 规则 的 
集合 中 存在 派生 的 过 程 称 为 语法 分 析 (parsing )。 扫 描 和 语法 分 析 是 编译 一 个 程序 的 前 两 个 步骤 。 

当然 ， 扫 描 器 和 语法 分 析 器 也 许 会 发 现 输入 不 是 一 个 合法 的 语句 。 在 这 种 情况 下 ， 编 译 器 必须 向 用 
户 报告 错误 信息 。 它 将 提供 简明 而 有 用 的 反馈 ， 从 而 使 用 户 能 够 找到 并 改正 语法 错误 。 

2. 检测 语义 

语法 正确 性 完全 依赖 于 词性 和 字 到 它 的 词性 的 映射 。 语 法 检测 忽视 字 的 意义 。 文 法 规则 不 区 分 两 个 
名 词 之 间 的 差异 ， 例 如 “compilers” 和 “rocks” 之 间 的 差异 。 因 此 ， 在 文法 上 ， 句子 “Compilers are 
engineered objects.” 与 “Rocks are engineered objects.” 之 间 没 有 区 别 ， 即 使 它们 有 完全 不 同 的 含义 。 
为 了 弄 清楚 这 两 个 句子 的 差异 需要 软件 系统 和 地 质 对 象 的 相关 知识 。 

在 前 端 能 够 把 输入 程序 翻译 成 编译 器 的 还 之 前 ， 它 必须 确认 程序 有 明确 的 意义 。 语 法 分 析 可 以 在 把 
词性 和 文法 规则 相 比 较 的 级 别 上 确认 句子 是 合法 的 。 然 而 ， 正确 性 和 意义 不 仅 局 限于 此 。 在 英语 句子 中 ， 
读者 必须 理解 单词 的 定义 ， 邑 它们 的 外 延 和 内 涵 。 在 程序 设计 语言 中 ， 编 译 器 必须 保证 变量 名 的 使 用 与 
它们 的 声明 一 致 。 在 上 述 两 种 情况 下 ， 分 析 必 须 做 更 多 工作 ， 而 不 只 是 局 限于 检查 拼写 和 它 的 语法 范畴 。 

合式 的 计算 机 程序 揽 述 某 种 计算 。 下 面 的 表达 式 可 以 在 很 多 情况 下 不 合法 ， 而 不 仅仅 会 出 现 典型 的 
语法 错误 。 


We-wx 2x Xx yrzZ 


例如 ， 一 个 或 多 个 名 字 可 能 没有 定义 。 变 量 x 也 许 从 没有 声明 。 变 量 y 和 z 也 许 是 不 同类 型 的 ， 它 们 
不 能 做 乘法 。 

在 编译 器 中 ， 可 以 通过 语义 分 析 (semantic analysis) 或 上 下 文 相关 分 析 (〈contextrsensitive analysis) 
来 发 现 这 样 的 错误 。 后 者 强调 这 样 的 观点 : 输入 的 某 些 部 分 的 含义 可 能 依赖 于 它 前 面 的 内 容 、 后 面 的 内 
容 或 同时 依赖 于 两 者 。 编 译 器 的 前 端 也 许 包 含 独立 的 执行 语义 分 析 的 遍 ， 或 者 把 这 一 分 析 又 加 到 语法 分 
析 器 中 。 无 论 是 哪 种 情况 ， 检 查 输入 的 语义 错误 的 过 程 推 导出 程序 含义 的 重要 信息 ， 这 一 信息 塑造 编译 
器 前 端 所 生成 的 程序 的 玉 的 形式 。 

3. 学 习 向 导 

第 2 章 到 第 4 章 描 述 编译 器 前 端 中 用 于 分 析 输 入 程序 、 确 定 输入 程序 是 否 合法 以 及 使 用 某 种 内 部 形式 
构造 代码 表示 的 算法 和 技术 。 第 5 章 和 附录 B 阅 述 在 设计 和 实现 用 于 整个 编译 器 的 内 部 结 寺 构 时 出 现 的 问题 。 
前 端 构筑 许多 这 样 的 结构 。 


1.5.2 创建 和 维护 运行 时 环境 


编译 器 实现 由 源 语言 定义 的 抽象 。 编 译 中 所 关心 的 就 是 寻找 创建 这 些 抽象 表示 的 有 效 方法 。 考 虑 我 
们 的 例子 ，W<w x 2 x Xx x yx z。 它 展示 了 一 个 特殊 的 抽象 : 符号 名 。 这 一 表达 式 涉及 w、x、y 和 Zz。 这 些 
名 字 不 只 是 值 ; w 既 出 现在 赋值 操作 符 的 右边 又 出 现 它 的 左边 。 显 然 ， 当 x x y x z 不 为 1/2 时 ， 在 执行 这 
一 表达 式 之 前 它 有 一 个 值 ， 而 在 执行 之 后 它 又 有 另外 一 个 值 。 因 此 ，w 涉 及 存储 在 一 个 被 命名 的 位 置 中 
的 这 个 值 ， 而 不 是 一 个 如 15 这 样 的 特定 值 。 

现代 计算 机 是 通过 数值 地 址 而 不 是 通过 文本 名 来 组 织 内 存 的 。 在 一 个 正在 运行 的 程序 的 地 址 空间 内 ， 
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这 些 地 址 惟一 确定 存储 位 置 。 然 而 在 源 程 序 中 ， 程 序 员 可 以 创建 多 个 具有 相同 文本 名 的 不 同 变量 。 例 如 ， 
很 多 程序 在 若干 不 同 的 过 程 中 定义 变量 1、j 和 ki; 它们 是 循环 索引 变量 的 通用 名 字 。 编 译 器 负责 把 名 字 j 的 
每 次 使 用 映射 到 j 的 适当 实例 上 ， 由 此 再 映射 到 为 j 的 那个 实例 保留 的 存储 位 置 上 。 计 算 机 没有 这 种 存储 位 
置 的 名 字 空 间 ; 它 是 由 语言 设计 者 创建 并 由 编译 器 生成 的 代码 以 及 它 的 运行 时 环境 所 维护 的 一 个 抽象 。 

为 了 翻译 wewx 2 x x x y x z， 编 译 器 必须 给 每 个 名 字 指 定 一 个 存储 位 置 。( 此 时 ， 我 们 假设 常量 2 不 
需要 内 存 位 置 ， 因 为 它 是 一 个 小 整数 而 且 可 以 通过 立即 装 入 指令 得 到 它 。) 编译 器 通过 给 每 个 名 字 指 定 
一 个 地 址 在 内 存 中 保存 这 些 名 字 的 值 ， 例 如 <w，0>、<x，4>、<y，8> 和 <z，12> ， 这 里 假设 每 个 值 取 四 
个 字 节 。 另 外 ， 编 译 器 也 许 会 选择 使 用 一 系列 赋值 ， 如 <w，ri>、<x，rz>、<y，ry> 和 <Zz，rs> 等 在 机 器 
的 寄存 器 中 保存 这 些 变量 。 

存储 位 置 的 选择 既 依赖 于 语 境 的 上 下 文 ， 同 时 又 对 上 下 文 产 生 影 响 。 将 w 存 放 于 寄存 器 中 很 有 可 能 
导致 更 快 的 执行 。 遗 憾 的 是 ， 目 标 机 器 只 提供 有 限 组 寄存 器 单元 ; 因此 ， 也 许 没 有 是 够 的 寄存 器 来 存放 
w。 另 外 ， 程 序 也 可 能 不 允许 编译 器 在 寄存 器 中 存放 w。 

名 字 只 是 编译 器 维护 的 抽象 的 一 种 。 每 个 程序 设计 语言 都 定义 很 多 抽象 ， 程 序 员 使 用 这 些 抽象 来 编 
写 代码 。( Scheme、Java、FORTRAN 中 的 快速 排序 (QuickSort) 的 实现 看 起 来 就 相当 不 同 。) 这 些 抽象 
使 程序 员 不 必 了 解 他 们 所 使 用 的 计算 机 系统 的 底层 细节 。 某 些 抽象 很 容易 实现 ; 在 汇编 语言 中 的 助 记 符 
直接 映射 到 目标 机 器 的 操作 码 上 。 其 他 一 些 抽 象 则 很 难 实现 ; SETL 中 的 基于 集合 的 抽象 需要 编译 器 从 
高 级 别 的 集合 论 操 作 符 中 推断 出 高 效 的 算法 。 

为 了 处 理 一 个 完整 的 程序 设计 语言 ， 编 译 器 必须 创建 并 支持 各 种 抽象 。 过 程 、 参 数 、 名 字 、 词 法 作 
用 域 以 及 控制 流 操作 都 是 源 语言 的 抽象 。 在 与 其 他 系统 软件 的 协同 中 ， 编 译 器 创建 并 维护 这 些 抽象 在 目 
标 机 器 上 的 实现 。 编 译 器 必须 在 编译 时 发 行 适 当 的 指令 ; 而 其 他 部 分 还 涉及 编译 代码 与 这 些 代码 所 支持 
的 运行 时 环境 之 间 的 相互 作用 。 

设计 和 实现 编译 器 涉及 一 系列 机 制 的 构建 ， 这 些 机 制 将 创建 并 维护 程序 运行 时 的 必要 的 抽象 。 这 些 
机 制 必须 处 理 内 存 的 布局 和 分 配 、 过 程 间 的 控制 转换 、 值 的 传播 、 在 过 程 的 边界 处 的 名 字 空 间 的 映射 ， 
以 及 处 理 与 编译 器 控制 之 外 的 外 部 世界 的 接口 ， 这 些 接口 包括 输入 和 输出 设备 、 操 作 系 统 以 及 其 他 正在 
运行 的 程序 。 

学 习 向 导 

第 6 章 探讨 编译 器 必须 维护 的 抽象 ， 抽 象 的 作用 是 在 源 语言 中 的 程序 设计 模型 与 操作 系统 及 实际 的 
硬件 所 提供 的 设备 之 间 搭 建 桥梁 。 我 们 将 描述 编译 器 用 来 实现 包含 在 语言 定义 中 的 各 种 抽象 所 需要 的 算 
法 和 技术 ， 曾 述 编译 器 领域 和 操作 系统 领域 的 一 些 边缘 问题 。 

第 7 章 曾 述 本 书 其 他 部 分 的 基础 知识 。 优 化 和 代码 生成 只 是 挖掘 IR 程 序 展 示 的 细节 。 因 此 ，IR 表 示 
什么 以 及 如 何 表 示 等 的 特定 决策 对 优化 器 的 有 效 性 和 代码 生成 器 所 生成 的 代码 的 质量 产生 重要 的 影响 。 
这 一 章 关注 “代码 形态 ”和 编译 器 设计 者 就 如 何 实 现 特定 源 语言 结构 所 做 的 一 系列 选择 。 


15.3 改进 代码 


通常 ， 编 译 器 可 以 使 用 上 下 文 关 系 的 知识 来 改进 它 为 语句 生成 的 代码 的 质量 。 如 图 1-2 左 边 所 示 ， 
如 果 我 们 给 出 的 例子 中 的 语句 被 嵌入 一 个 循环 ， 那 么 上 下 文 的 信息 可 能 使 得 编译 器 给 代码 带 来 显著 的 改 
进 。 编 译 器 能 够 识别 出 子 表达 式 2 x x x y 是 循环 中 的 不 变量 ， 也 就 是 说 ， 这 个 子 表达 式 的 值 在 循环 间 不 
发 生变 化 。 那 么 编译 器 就 可 以 如 图 1-2 右 侧 所 示 重 写 代码 。 转 换 后 的 代码 在 循环 体 中 执行 更 少 的 操作 。 
如 果 循 环 执行 多 次 ， 那 么 转换 后 的 代码 应 该 比 原来 的 代码 运行 得 更 快 。 





X 4 -，.， 
X ee eee Yeu 
Yeu: weil 
weil 、 t<e2x“xxxy 
for i= 1lton for i= 1 ton 
read z read z 
wewx2xxxyxz wewxzxt 
end end 


语 境 上 下 文 改进 后 的 代码 





图 1-2 不 同 的 上 下 文 导 致 不 同 的 结果 


根据 上 下 文 的 关系 发 现 事 实 ， 分 析 代码 并 用 这 些 知识 来 改进 代码 的 过 程 通常 称 为 代码 优化 (code 
optimization)。 大 体 说 来 ， 优 化 包括 两 种 不 同 的 活动 :. 分 析 代码 从 而 理解 代码 的 运行 时 行为 ， 以 及 转换 
代码 来 利用 在 分 析 中 得 到 的 知识 。 这 些 技术 在 编译 代码 的 性 能 上 起 着 至 关 重要 的 作用 ; 好 的 优化 器 的 存 
在 对 编译 器 其 余部 分 的 设计 和 实现 有 着 重要 的 影响 。 

1. 分 析 

编译 器 使 用 多 种 分 析 来 支持 转换 。 数 据 流 分 析 (data-flow analysis) 涉及 在 编译 时 推演 出 运行 时 的 
值 的 流向 。 数 据 流 分 析 器 通常 要 对 一 组 集合 等 式 同时 求解 ， 这 些 集合 等 式 由 翻译 代码 的 结构 推出 。 相 关 
性 分 析 (dependence analysis) 使 用 数论 测试 来 对 下 标 表达 式 的 值 进行 推理 。 它 通常 用 来 消除 数组 元 素 
引用 中 的 歧义 性 。 

2. 转换 

已 经 开发 出 很 多 不 同 的 转化 方法 ， 它 们 都 是 为 了 改进 可 执行 代码 所 需要 的 时 间 和 空间 而 设计 的 。 其 
中 有 一 些 转换 ， 例 如 像 发 现 循环 不 变量 的 计算 并 把 这 些 循环 不 变量 移 到 不 频繁 执行 的 位 置 这 样 的 转换 ， 
可 以 改进 程序 的 运行 时 间 。 另 外 一 些 转换 使 代码 更 紧凑 。 对 于 不 同 的 转换 ， 它 们 的 效果 、 它 们 操作 的 作 
用 域 以 及 进行 转换 所 需 的 分 析 等 都 各 不 相同 。 通 常 ， 我 们 将 转换 与 确保 这 个 转换 安全 是 有益 所 需要 的 分 
析 捆 绑 在 一 起 。 我 们 称 这 样 的 组 合 为 优化 (optimization). 

3. 学 习 向 导 

第 8 章 到 第 10 章 介绍 优化 器 。 第 8 章 通过 详细 的 例子 介绍 优化 的 一 些 术语 ， 其 中 不 做 过 多 的 计算 。 
第 8 章 还 给 出 跨越 不 同 作用 域 并 以 不 同方 式 工作 的 算法 。 第 9 章 介绍 数据 流 分 析 领 域 的 知识 ， 同 时 给 出 
构建 程序 的 静态 单 赋值 形式 的 算法 。 第 10 章 给 出 标量 转换 的 分 类 ， 以 及 基于 这 一 分 类 的 大 部 分 种 类 的 
优化 实例 。 


1.5.4 生成 输出 程序 


编译 的 最 后 阶段 是 代码 生成 。 在 代码 生成 的 过 程 中 ， 编 译 器 遍历 代码 的 IR 形 式 ， 并 为 目标 机 器 生成 
等 价 的 代码 。 它 选择 目标 机 器 的 操作 来 实现 代码 中 的 每 个 玉 操 作 。 它 要 决定 使 操作 能 够 高 效 运行 的 顺序 ， 
决定 哪些 值 需要 存放 在 寄存 器 中 ， 哪 些 值 应 该 存放 在 内 存 中 ， 并 插入 实施 这 些 决定 的 代码 。 

1. 指令 筛选 

指令 筛选 是 代码 生成 的 第 一 个 阶段 。 代 码 生成 器 选择 一 系列 机 器 指令 来 实现 被 编译 的 代码 。 为 使 语 
名 wewx2xxxyxz 在 ILOC 虚 拟 计算 机 上 执行 ， 编 译 器 可 能 选择 图 1-3 所 示 的 操作 。 代 码 假设 w、x、y 
和 z 分 别 被 存放 在 距 寄 存 器 ra 中 的 地 址 偏 移 量 为 ew、@x、@y 和 @z 的 位 置 。 
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loadAI Tarp, OW => ry [ŻA ‘w 

loadI 2 > r // 把 常量 2 装 和 rz 

ToadAI Tarp, @x > rx ILEA tx! 

ToadAI rarp, OY ry // BA 'y' 

loadAI rarp, @2 > rz // A ‘2! 

mult Toe re => Vw //r wx2 

mult mr => My // w — (wx2)xx 

mult r,s > Ty [| He (Wx 2x x) xy 
mult sry, > ry [/ w e (Wx 2xx xy) xz 
stareAl rẹ => Tarps @w // 把 r, 写 回 'w' 


关于 ILOC 

本 书 中 ， 我 们 使 用 称 为 ILOC 的 表 记 法 来 书写 低级 的 例子 。ILOG 是 “intermediate language for 
an optimizing compiler” 的 首 字符 缩写 。 多 年 来 ， 这 一 表 记 法 已 经 发 生 了 很 多 变化 。 我 们 将 在 附录 AA 
中 详细 说 明 本 书 所 使 用 的 版 本 。 

把 ILOC 想 像 成 简单 的 RISC 计 算 机 的 汇编 语言 。 它 有 一 个 标准 的 操作 集合 。 大 部 分 操作 的 参数 
是 寄存 器 。 内 存 操作 10ad 和 store 在 内 存 和 寄存 器 之 间 传 输 值 。 为 了 简化 文字 说 明 ， 大 多 数 例 子 都 
假设 所 有 数据 都 是 由 整数 组 成 的 。 

每 个 操作 都 有 一 组 操作 数 和 一 个 目标 。 操 作 由 五 部 分 组 成 : 操作 名 、 操 作 数 列表 、 分 隔 符 号 、 目 
标 列 表 和 可 选 的 注释 。 因 此 ， 将 寄存 器 1 和 寄存 器 2 的 内 容 相 加 并 把 结果 保存 在 寄存 器 3 中 的 操作 为 : 

add ri, rs =r, // 指令 例子 i 
分 隔 符号 一 置 于 目标 列表 的 前 面 。 它 形象 地 表示 信息 是 从 左边 流向 右边 的 。 特 别 地 ， 它 消除 了 混淆 
操作 数 和 目标 的 可 能 ， 而 阅读 汇编 文本 的 人 很 容易 产生 这 样 的 混 淇 。( 参 看 下 表 中 的 10adAI 和 
storeAl. ) 

图 1-3 中 的 例子 只 使 用 四 个 ILOC 操 作 : 

ILOC 操 作 意 x 


Memory (r; +c) > r; 


Cl 一 六 2 


10adAI ri,c, =fr; 
loadl c, =r, 
mult rrz =>; 
storeAl r) =r, C? 


附录 A 给 出 了 ILOC 的 更 详细 描述 。 这 些 例子 始终 使 用 名 字 Tr ,rp 为 特定 寄存 器 ， 它 或 者 存放 当前 
过 程 的 数据 存储 的 起 始 地 址 ， 或 者 存放 活动 记录 指针 (activation record pointer). 


rxre™> Tr 


Yr, 一 Memory (r,+ C2) 





这 一 代码 序列 是 显而易见 的 。 它 把 所 有 相关 数据 装 入 到 寄存 器 中 ， 依 次 执行 乘 运算 ， 并 将 结果 存储 
于 w 的 内 存 位 置 中 。 它 假设 有 足够 多 的 寄存 器 ， 并 以 诸如 rv 来 命名 这 些 寄存 器 来 保存 w， 同 时 用 ra 来 保 
存 数据 存储 的 起 始 地 址 。 无 疑 ， 指 令 筛 选 器 需要 依靠 寄存 器 分 配器 来 把 这 些 符 号 寄存 器 名 或 虚拟 寄存 器 


映射 到 目标 机 器 的 真实 寄存 器 上 。 
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依赖 于 目标 机 器 的 性 质 ， 指 令 筛 选 的 遍 可 以 作出 其 他 选择 。 例 如 ， 如 果 立 即 乘 操作 (multl) 是 可 
用 的 ， 那 么 可 以 将 mu1t mrv，rz 一 mv 换 成 multI rv，2 一 rv， 消 除 对 操作 1oadI 2 一 r: 的 需求 ， 而 且 减 少 所 
需 寄存 器 的 数量 。 如 果 加 法 操作 比 乘法 操作 更 快 的 话 ， 那 么 这 个 操作 将 会 被 操作 add r, ror, 
从 而 回避 1oadI 和 它 对 r: 的 使 用 ， 同 时 用 较 快 的 add 取 代 muit。 

2. 寄存 器 分 配 

在 指令 筛选 中 ， 编 译 器 有 意 忽 略 目标 计算 机 只 有 有 限 多 个 寄存 器 的 事实 。 它 使 用 任意 多 个 康 拟 寄存 
器 并 假设 有 “足够 多 ”的 寄存 器 。 在 实践 中 ， 编 译 的 早期 阶段 也 许 会 创建 比 硬件 所 能 支持 的 寄存 器 更 多 
的 虚拟 寄存 器 。 把 这 些 虚 拟 寄存 器 映射 到 目标 计算 机 的 真实 寄存 器 的 任务 就 落 到 了 寄存 器 分 配器 的 身上 。 

寄存 器 分 配器 决定 在 代码 的 各 点 哪些 值 应 该 存放 在 目标 计算 机 的 寄存 器 中 。 然 后 它 要 修改 代码 来 反 
映 它 的 决定 。 例 如 ， 试 图 最 小 化 所 使 用 的 寄存 器 数目 的 寄存 器 分 配器 也 许 要 把 图 1-3 的 代码 重 写成 如 下 
形式 : 


loadAI Tarp, Cw > ri // 装 入 Ww' 

add ns, >r [; rn owx?2 

loadAI Tarps ÈX => rz // BA tx" 

mlt nn,r 之 mi // 11 e (wx 2) xx 

loadAI Tarps ey > rz // BA 'y' 

mult fi, te >ñ {[[ ne wx 2x x) Ky 
1oadAI Tarp, @Z 一 rz // BA 2! 

mult msrz ë >ñ Ii m 4 (wx2xxxy)xz 
storeAl rı = Tarp» Ow // 把 r, 写 回 'w' 


这 一 代码 序列 使 用 三 个 寄存 器 而 不 是 六 个 。 

最 小 化 寄存 器 的 使 用 也 许 不 能 带 来 理想 的 结果 。 例 如 ， 如 果 所 有 被 命名 的 值 W、x、y 和 z 都 已 经 在 寄 
存 器 中 ， 那 么 代码 将 直接 引用 这 些 寄存 器 。 如 果 所 有 的 值 都 在 寄存 器 中 ， 我 们 无 需 额外 的 寄存 器 就 可 以 
”实现 这 一 代码 序列 。 反 之 ， 如 果 某 个 邻近 的 表达 式 也 计算 w x 2， 那 么 把 那个 值 保存 在 寄存 器 中 要 比 以 后 
重新 计算 这 个 值 更 好 。 这 将 增加 对 寄存 器 的 需求 ,但 是 消除 了 后 面 的 一 个 指令 。 

把 任意 多 个 值 分 配 到 有 限 的 机 器 寄存 器 集合 的 同时 保证 装 入 和 存储 的 次 数 最 少 的 问题 是 NP 完全 的 。 
因此 ， 我 们 不 能 期 望 编译 器 能 给 出 这 一 问题 的 最 优 解 ， 除 非 我 们 对 某 些 编译 允许 指数 时 间 (的 复杂 性 )。 
在 实践 中 ， 编 译 器 使 用 逼近 技术 来 发 现 这 一 问题 的 较 好 解 ; 这 些 解 可 能 不 是 最 优 解 ， 但 是 逼近 技术 确保 
可 以 在 合理 的 时 间 内 找到 某 个 解 。 

3. 指令 调度 

为 了 生成 快速 运行 的 代码 ， 代 码 生成 器 也 许 需要 重新 排列 操作 来 反映 目标 计算 机 的 特定 性 能 约束 。 
不 同 操作 的 执行 时 间 可 能 完全 不 同 。 内 存 存 取 操 作 可 能 会 花 几 十 到 几 百 个 周期 ， 而 某 些 算术 操作 ， 特 别 
是 乘法 ， 可 能 花费 几 个 周期 。 这 些 等 待 时 间 较 长 的 操作 对 编译 代码 的 性 能 的 影响 可 能 是 巨大 的 。 


| 术语 
细心 的 读者 会 注意 到 我 们 在 很 多 使 用 程序 (program) 或 过 程 (procedure ) 可 能 更 自然 的 地方 | 


使 用 了 单词 代码 (code)。 我 们 是 有 意 这 样 做 的 ; 编译 器 可 能 用 于 翻译 小 到 单一 的 引用 大 到 一 
整 程序 系统 的 代码 片段 的 翻译 。 我 们 不 去 特殊 指定 编译 的 范围 ， 而 是 继续 使 用 这 一 含义 村 煌 人 更 具 
一 般 性 的 词汇 : 代码 。 








12 条 了 全 


在 此 ， 我 们 假设 10adAI 和 storeAI 操 作 需 要 三 个 周期 ，mult 需 要 两 个 周期 ， 所 有 其 他 操作 都 需要 一 
个 周期 。 下 面 给 出 的 代码 列表 给 出 了 前 面 代码 片段 在 这 些 假设 下 的 运行 状况 “开始 ” 栏 给 出 了 每 个 操 
作 开 始 时 的 周期 数 ， 而 “结束 ” 栏 给 出 每 个 操作 完成 时 的 周期 数 。 


F 始 结 柬 
1 © 3 loadAI Tuy, @W 一 六 // A'W 
4 4 add ro r =r; // t wx 
5 7 loadAI Fap @X =r, // ATX 
8 9 muit ris ry =r; // ro (wx2)xx 
10 12 loadAI Tarp @¥ Sr, // 装 入 'y' 
13 14 mult ri, rs => f) // r, e (wx2xx)xy 
15 17 loadAl fap @Z =r, // A'T 
18 19 mult Tis Yo 一 站 // ri e (wx2xxxy)xz 
20 22 storeAl r, 一 Tarp，@wW // 把 r, 写 回 'w' 


上 表 中 的 九 个 操作 的 运行 需要 22 个 周期 。 最 小 化 寄存 器 数目 不 能 导致 快速 运行 。 

很 多 现代 处 理 器 具有 这 样 的 性 质 : 它们 可 以 在 运行 长 等 待 时 间 的 操作 的 同时 启动 新 的 操作 。 只 要 直 
到 长 等 待 时 间 操作 的 结果 在 它 完成 运行 之 前 不 被 引用 ， 那 么 运行 就 可 正常 进行 。 然 而 ， 如 果 某 个 播 进来 
的 操作 要 在 这 一 长 等 待 时 间 操 作 完 成 之 前 读 取 它 的 结果 、 那 么 处 理 器 就 会 “停机 ”， 或 者 等 待 这 个 长 等 
待 时 间 操 作 完 成 。 一 个 操作 在 它 的 操作 数 准 备 就 绪 之 前 不 能 开始 运行 ， 并 且 在 这 一 操作 结束 之 前 不 能 读 
取 它 的 结果 。 

指令 调度 器 要 重 排 代码 中 的 操作 。 指 令 调度 器 设法 使 浪费 在 停机 的 周期 数目 最 少 。 当 然 ， 调 度 器 必 
须 确保 新 的 操作 序列 产生 与 原来 操作 序列 相同 的 结果 。 在 很 多 情况 下 ， 调 度 器 能 够 显著 改进 “朴素 ” 代 
码 的 性 能 。 对 于 我 们 的 例子 ， 优 秀 的 调度 器 可 能 会 产生 下 面 的 操作 序列 : 


开 始 OR 
1 3 loadAI rarp, @W Sr; // ACW 
2 4 loadAl arp» OX =r, // BAT 
3 5 loadAl fay, @Y 一 ri // 装 入 'y' 
4 4 add rh, vy =r; // ri —wx2 
5 6 mult Ti, re =r; // r = (wx2)xx 
6 8 JoadAI Taps @Z =r; // BAZ 
7 8 mult ri, rs =r; // r, = (wx2xx)xy 
9 10 mult mr ë >ñ // ri (Wx 2x xxy) x2 
11 13 storeAI r; 二 Tp，@W // ÆRBE'W 


代码 的 这 一 版 本 的 运行 只 需要 13 周 期 。 这 一 代码 比 最 小 寄存 器 数目 版 本 多 需要 一 个 寄存 器 。 除 了 第 8、 
第 10 和 第 12 个 周期 外 ， 它 在 每 个 周期 启动 一 个 操作 。 这 一 调度 不 是 惟一 的 ; 存在 若干 等 价 的 调度 ， 例 如 
使 用 更 多 寄存 器 的 等 长 调度 。 

如 同 寄存 器 分 配 一 样 ， 指 令 调度 是 一 个 困难 的 问题 。 它 的 一 般 形 式 是 NP 完全 的 。 因 为 这 一 问题 以 
各 种 形式 出 现在 很 多 领域 ， 所 以 它 备 受 关注 。 

4. 交互 作用 

编译 过 程 中 的 大 多 数 棘手 问题 都 出 现在 代码 生成 的 过 程 中 。 这 些 问 题 之 间 的 交互 作用 使 问题 更 加 复 
杂 。 例 如 ， 指 令 调 度 将 10ad 操 作 从 依赖 于 它们 的 算术 操作 移 开 。 这 一 做 法 可 能 增加 需要 这 些 值 的 时 间 ， 
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相应 地 增加 在 这 段 时 间 内 所 需要 的 寄存 器 的 数目 。 同 样 地 ， 特 殊 值 到 特定 寄存 器 的 赋值 可 能 通过 引发 两 
个 操作 之 间 的 “ 假 ” 依 赖 而 限制 指令 调度 。( 第 一 个 操作 完成 之 前 不 能 调度 第 二 个 操作 ， 即 便 公用 寄存 
器 中 的 值 相互 独立 时 也 是 如 此 。 以 使 用 更 多 寄存 器 为 代价 ， 重 命名 值 可 以 消除 这 种 假 依赖 。 ) 


令 人 振奋 的 时 代 


这 是 编译 器 设计 和 实现 的 令 人 振奋 的 时 代 。 在 20 世 纪 80 年 代 ， 几 平 所 有 的 编译 器 都 是 大 型 单 块 
系统 。 它 们 以 少数 几 种 语言 之 一 作为 输入 ， 并 为 某 个 特定 的 计算 机 产生 汇编 代码 。 这 一 汇编 代码 与 
包括 系统 函数 库 和 应 用 函数 库 在 内 的 其 他 编译 所 产生 的 代码 一 起 联合 起 来 ， 形 成 可 执行 代码 。 这 一 | 
可 执行 代码 被 存储 在 磁盘 上 ; 在 适当 的 时 候 ， 这 一 最 终 的 代码 被 从 磁盘 移 到 主 存 中 并 执行 。 | 

今天 ， 编 译 器 技术 已 开始 应 用 于 很 多 不 同 的 框架 。 随 着 计算 机 在 各 个 不 同 领域 找到 其 应 用 , 编 | 
译 器 必须 应 付 新 的 不 同 的 限制 。 速 度 不 再 是 衡量 编译 代码 的 惟一 标准 。 今 天 ， 人 们 可 能 要 依据 编译 | 


代码 的 大 小 、 所 消耗 的 能 源 量 、 压 缩 的 程度 或 者 运行 时 所 生成 的 页 错误 的 多 少 等 因素 来 衡量 代码 。 | 

与 此 同时 ， 编 译 技术 已 经 脱离 了 20 世 纪 80 年 代 的 单 块 系统 。 它 们 呈现 出 很 多 新 局 面 。Java 编 译 
器 采用 (以 Java 的 “ 字 节 代码 ”形式 出 现 的 ) 特殊 的 编译 程序 ， 并 把 它们 翻译 成 目标 机 器 的 本 地 代 | 
码 。 在 这 样 的 环境 下 ， 成 功 要 求 编译 时 间 与 运行 时 间 的 总 和 必须 小 于 解释 代码 所 需 的 成 本 。 分 析 整 
个 程序 的 技术 正在 从 编译 时 转向 链接 时 ， 因 为 连接 器 可 以 为 整个 应 用 程序 分 析 汇 编 代 码 ， 并 使 用 分 
析 得 到 的 知识 改进 这 一 程序 。 最 后 ， 人 们 正在 尝试 在 运行 时 调用 编译 器 来 利用 任意 早期 无 法 知道 的 | 
事实 生成 优化 代码 。 如 果 编 译 时 间 可 以 保持 到 很 小 ， 而 且 收 益 很 大 ， 那 么 这 一 策略 能 够 产生 显著 的 


5. 学 习 向 导 

第 11 章 到 第 13 章 描述 代码 生成 过 程 中 出 现 的 问题 ， 并 给 出 处 理 这 些 问题 的 各 种 技术 。 第 11 章 讨论 指 
令 筛选 的 算法 ， 也 就 是 如 何 把 一 个 特殊 的 代码 形态 映射 到 目标 计算 机 的 指令 集 上 。 因 为 执行 顺序 可 以 很 
大 程度 地 影响 编译 代码 的 性 能 ， 所 以 第 12 章 集中 研究 指令 调度 的 算法 。 最 后 ， 第 13 章 将 考虑 决定 将 哪些 
值 保存 在 寄存 器 中 的 问题 ， 并 探讨 编译 器 用 来 做 出 这 些 决定 的 算法 。 


1.6 编译 器 应 有 的 性 质 


编译 器 的 基本 原则 告诉 我 们 编译 器 必须 做 什么 。 然 而 ， 这 些 原则 却 不 能 对 一 个 编译 器 应 有 的 所 有 性 
质 和 行为 给 出 描述 。 虽 然 特定 的 编译 器 拥有 它们 自己 的 优势 各 局限， 我 们 往往 要 根据 五 个 不 同 领域 的 性 
能 来 评价 编译 器 。 

1. 速度 (Speed) 

无 论 何 时 ， 我 们 都 会 要 求 某 些 应 用 软件 具有 比 它 们 能 够 容易 得 到 的 性 能 更 高 的 性 能 。 例 如 ， 模 拟 像 
微 处 理 器 这 样 的 数字 电路 的 能 力 总 是 远 远 落 后 于 对 这 样 的 模拟 的 要 求 。 类 似 地 ， 诸 如 气候 建 模 问 题 等 大 
型 物理 问题 总 是 需要 大 量 的 计算 。 对 于 这 些 应 用 软件 ， 编 译 代码 的 运行 时 性 能 是 至 关 重 要 的 问题 。 获 得 
可 预期 的 好 性 能 需要 编译 时 的 额外 分 析 和 转换 。 这 样 的 额外 工作 项 要 更 长 的 编译 时 间 ,， 

2. 空间 (Space) 

很 多 应 用 软件 对 编译 代码 的 尺寸 有 很 严格 的 限制 。 这 些 限制 通常 来 自 于 物理 因素 或 经 济 因素 。 例 如 ， 

手持 计算 机 的 能 量 消耗 部 分 地 依赖 于 它 所 含有 的 内 存量 。 代 码 经 常 存放 在 只 读 存 储 器 (ROM) 中 ; 代 
码 尺 寸 决定 设备 所 需要 的 ROM。 从 网 格 计算 到 嵌入 了 applet 的 网 页 的 各 种 环境 在 代码 运行 之 前 都 要 在 计 
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算 机 之 间 传 递 可 执行 代码 ; 这 对 编译 代码 的 尺寸 增加 了 额外 开销 。 通 过 设计 编译 器 可 以 致力 于 生成 紧凑 
代码 。 然 而 ， 紧 次 代 码 与 快速 代码 的 期 望 可 能 相互 抵触 。 

3. 反馈 (Feedback) 

当 编 译 器 过 到 不 正确 的 程序 时 ， 它 必须 向 用 户 报 告 这 一 事实 。 提 供给 用 户 的 信息 量 可 以 千差万别 。 
例如 ， 早 期 的 Unix 编 译 器 通常 生成 一 个 简单 而 统一 的 信息 : “语法 错误 。( syntax error.)” 而 作为 另 
一 个 极端 ，Cornell PL/C 系 统 和 UW-Pascal 系 统 被 设计 为 “学 生 ” 编 译 器 ,它们 努力 改正 程序 中 的 每 一 个 
语法 错误 再 去 编译 它 。 

4. 调试 (Debugging) 

遗憾 的 是 ， 大 多 数 程序 不 能 在 编译 后 马上 正确 地 运行 。 因 此 ， 程 序 员 对 调试 器 的 能 力 寄予 了 很 高 的 
期 望 ， 这 样 的 调试 器 能 够 对 编译 代码 进行 源 程 序 级 别 的 调试 。 如 果 调 试 器 设法 把 出 错 的 可 执行 代码 的 状 
态 与 源 代码 联系 起 来 的 话 ， 那 么 大 动 干戈 的 程序 转换 所 大 来 的 复杂 性 可 能 会 使 调试 器 误导 程序 员 。 因 此 ， 
编译 器 设计 者 和 用 户 都 可 能 被 迫 在 编译 器 代码 的 效率 和 调试 器 的 透明 度 之 间 做 出 选择 。 这 就 是 为 什么 很 
多 编译 器 都 有 一 个 “调试 ”标志 ， 这 一 调试 标志 阻止 编译 器 使 用 使 源 代 码 和 执行 程序 之 间 的 关系 模糊 的 
转换 。 

5. 编译 时 效率 (Compile-Time Efficiency) 

编译 器 的 使 用 频率 非常 高 。 在 很 多 情况 下 ， 编 译 器 的 用 户 要 等 待 编译 的 结果 ， 所 以 编译 速度 可 能 是 
一 个 重要 的 问题 。 在 实践 中 ， 没 有 人 喜欢 等 待 编译 器 完成 工作 。 也 许 有 些 用 户 能 够 容忍 缓慢 的 编译 ， 特 
别 是 当代 码 质量 出 现 严 重 问题 时 。 然 而 ， 如 果 在 产生 相同 结果 的 缓慢 的 编译 器 和 快速 的 编译 器 之 间 可 以 
作出 选择 的 话 ， 用 户 无 疑 会 选择 快速 编译 器 。 

在 阅读 本 书 其 余部 分 之 前 ， 你 应 该 列 出 你 希望 编译 器 应 有 的 特性 顺序 表 。 你 可 以 运用 软件 工程 的 传 
统 标准 评估 它 的 特性 ， 就 好 像 你 需要 为 它们 花费 你 自己 的 金钱 那样 ! 仔细 审查 你 的 列表 ， 你 会 学 会 在 构 
建 你 自己 的 编译 器 时 应 该 如 何 作 各 种 权衡 。 


1.7 概括 和 展望 


构造 编译 器 是 一 个 复杂 的 任务 。 优 秀 的 编译 器 把 来 自 于 形式 语言 理论 、 算 法 研究 、 人 工 智能 、 系 统 
设计 、 计 算 机 体系 结构 以 及 程序 设计 语言 理论 的 思想 结合 起 来 ， 并 把 它们 运用 于 翻译 程序 的 任务 。 编 译 
器 把 贪 禁 算 靶 、 试 探 技 术 、 图 形 算法 、 动 态 规划 、DEFA 和 NFA、 不 动 点 算法 、 分 配 和 命名 、 同 步 和 局 部 
化 、 管 道 管理 等 技术 结合 在 一 起 。 编 译 器 所 面临 的 很 多 问题 都 很 难得 到 最 优 的 解决 方案 ; 因此 ， 编 译 器 
使 用 有 逼近 、 试 探 和 经 验 。 这 导致 信人 咋舌 的 复杂 的 相互 作用 ， 无 论 是 好 的 还 是 坏 的 。 

为 了 使 这 一 活动 有 序 进 行 ， 大 多 数 编译 器 都 组 织 成 三 个 主要 阶段 : 前 端 、 优 化 器 和 后 端 。 每 个 阶段 
都 有 各 自 需 要 处 理 的 问题 ; 解决 这 些 问 题 的 方法 也 大 相 径 庭 。 前 端 主要 致力 于 把 源 程序 代码 翻译 成 某 个 
IR。 前 端 依赖 于 形式 语言 理论 和 类 型 论 的 结果 ， 依 赖 于 大 量 的 算法 和 数据 结构 。 而 中 间 阶 段 或 优化 器 ， 
把 IR 程 序 翻 译 成 另外 的 IR 程 序 ， 其 目的 是 获得 高 效 的 人 程序 。 优 化 器 分 析 程 序 得 到 程序 的 运行 时 行为 的 
信息 ， 然 后 利用 这 些 信息 转换 代码 并 改进 它 的 行为 。 后 端 把 IR 程 序 映射 到 特定 处 理 器 的 指令 集 上 。 后 端 
对 分 配 和 调度 中 的 难题 给 出 近似 解 ; 近似 解 的 质量 对 编译 代码 的 速度 和 尺寸 有 直接 的 影响 。 

本 书 分 别 讨论 这 三 个 部 分 。 第 2 章 到 第 4 章 处 理 编译 器 前 端 所 使 用 的 算法 。 第 5 章 到 第 7 章 给 出 讨论 优 
化 和 代码 生成 所 需 的 背景 资料 的 描述 。 第 8 章 介绍 代码 优化 ; 第 9 章 和 第 10 章 为 感 兴 趣 的 读者 提供 更 详细 
的 分 析 和 优化 处 理 。 最 后 ， 第 11 章 到 第 13 章 涵盖 后 端 所 需 的 指令 饰 选 、 调 度 和 寄存 器 分 配 技术 。 
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本 章 注释 


第 一 批 编 译 器 出 现 于 20 世 纪 50 年 代 。 这 些 早期 的 系统 显示 出 令 人 惊讶 的 复杂 度 。 原 始 的 FORTRAN 
编译 器 是 包括 独立 的 扫描 器 、 语 法 分 析 器 和 寄存 器 分 配器 以 及 某 些 优化 的 多 遍 系 统 [26，25]。 由 Ershov 
和 他 的 同事 在 Novosibirsk 设 计 的 Alpha 系 统 实现 了 局 部 优化 [13] 并 使 用 图 形 着 色 技术 来 降低 数据 项 所 需要 
的 内 存 数量 [132，133]。 . 

20 世 纪 60 年 代 早 期 ，Knuth 重 新 概括 了 一 些 有 趣 的 编译 器 构造 法 [221] 。Randell 和 Russell 描 述 了 对 
Algol 60 的 早期 实现 所 做 的 努力 [282]。Allen 描 述 了 IBM 内 部 的 编译 器 发 展 历史 ， 着 重 强调 理论 和 实践 的 
相互 作用 [14]。 

20 世 纪 60 年 代 和 20 世 纪 70 年 代 ， 人 们 构建 了 很 多 有 影响 力 的 编译 器 。 其 中 包括 经 典 的 优化 编译 器 
FORTRAN H[243，297]，Bliss-11 和 Bliss-32 编 译 器 [339，67]， 以 及 可 移植 的 BCPL 编 译 器 [289]。 这 些 
编译 器 为 各 种 复杂 指令 集 计算 机 (CISC) 生成 了 高 质量 的 代码 。 另 一 方面 ， 学 生 编译 器 则 致力 于 快速 纺 
译 、 优 秀 的 诊断 信息 以 及 错误 更 正 [92，139]。 

20 世 纪 80 年 代 ， 精 简 指令 集 计 算 机 (RISC) 构架 的 出 现 导致 了 新 一 代 的 编译 器 ; 这 些 编译 器 致力 
于 强大 的 优化 和 高 质量 代码 生成 [54，23，76，194]。 这 些 编译 器 配备 了 如 图 1-1 所 示 的 成 熟 的 优化 器 结 
构 。 现 代 的 RISC 编 译 器 仍然 沿用 这 一 模型 。 

20 世 纪 90 年 代 期 间 ， 编 译 器 构造 法 的 研究 集中 于 对 发 生 在 微型 处 理 器 结构 的 快速 变化 做 出 响应 。 这 
10 年 开始 于 Intel 的 i860 处 理 器 向 编译 器 设计 者 发 起 的 管道 管理 和 内 存 等 待 的 直接 挑战 。 此 后 ， 编 译 器 又 
面临 着 来 自 于 多 功能 单元 、 长 内 存 等 待 时 间 直 到 并 行 代码 生成 等 领域 的 挑战 。 实 践 证 明 ，20 世 纪 80 年 代 
的 RISC 编 译 器 的 结构 和 组 织 足以 灵活 地 应 付 这 些 新 挑战 ， 所 以 研究 人 员 在 编译 器 的 优化 和 代码 生成 阶段 
AR. 





2.1 概述 


扫描 是 编译 器 用 于 理解 输入 程序 的 三 个 部 分 过 程 的 第 一 个 。 扫 描 器 ， 或 词法 分 析 器 以 一 串 字 符 为 输 
入 ， 生 成 一 串 字 以 及 与 这 些 字 相关 的 语法 范畴 作为 输出 。 扫 描 器 收集 字符 形成 字 并 使 用 一 系列 规则 来 决 
定 每 个 字 在 源 语 言 中 是 否 合法 。 如 果 字 是 合法 的 ， 那 么 扫描 器 就 给 出 它 的 语法 范畴 或 词性 。 为 了 使 这 一 
过 程 得 以 高 效 进 行 ， 编 译 器 使 用 专门 的 识别 器 。 

本 章 将 阑 述 用 于 实现 词法 分 析 的 数学 工具 和 程序 设计 技术 。 扫 描 器 构架 的 大 部 分 工作 可 以 自动 完 
成 ; 实际 上 ， 这 是 运用 理论 结果 解决 重要 实际 问题 的 一 个 典型 例子 : 描述 并 识别 串 的 模式 。 用 于 描述 模 
式 的 自然 的 数学 公式 ， 称 为 正则 表达 式 (regular expression )。 这 一 数学 工具 直接 导致 称 为 有 穷 自 动机 

[27] (finite automata) 的 识别 器 ， 识 别 器 扫描 符号 串 寻 找 已 描述 的 模式 。 已 经 存在 这 样 的 工具 ， 它 们 利用 正 
则 表达 式 和 有 穷 自动 机 之 间 的 理论 关系 ， 从 描述 出 发 构建 高 效 、 专 用 的 识别 器 。 这 一 技术 已 应 用 于 很 多 
方面 ， 从 诸如 Unix grep 程 序 这 样 的 工具 到 网 站 过 滤 软 件 ， 到 在 文字 编辑 器 、 字 处 理工 具 以 及 命令 行 下 
的 正则 表达 式 “ 查 找 ” 命 令 。 

扫描 器 查看 字符 串 并 识别 字 。 控制 程序 设计 语言 的 词法 结构 的 规则 , 有 时 称 为 微 语法 (microsyntax ), 
是 简单 且 正 则 的 。 这 导致 扫描 的 高 效 、 特 化 识别 器 。 通 常 编译 器 的 前 端 使 用 扫描 器 来 识别 并 分 类 字 。 扫 
描 器 的 输出 是 一 串 字 ， 每 个 字 都 注 明 了 它 的 语法 范畴 或 词性 。 语 法 分 析 器 依次 使 用 这 些 字 。 语 法 分 析 器 
确定 这 些 字 是 否 形成 程序 设计 语言 中 的 一 个 语法 上 正确 的 句子 ， 即 一 个 程序 。 一 旦 编译 器 知道 这 个 输入 
在 语法 上 是 正确 的 ， 它 的 下 一 个 工作 就 是 进行 更 深 一 层 的 分 析 来 查看 程序 是 否 有 一 致 的 意义 ， 这 一 分 析 
有 时 称 为 上 下 文 相 关 分 析 (context-sensitive analysis )。 确 定 程序 是 否 有 意义 的 许多 细节 难以 用 语法 表 
示 ; 因此 编译 器 必须 使 用 更 复杂 的 技术 来 检测 这 些 细 节 。 

概念 上 ， 以 上 三 种 分 析 是 不 同 的 任务 。 在 实践 中 ， 它 们 通常 以 交 又 的 方式 运行 ， 语 法 分 析 器 通过 调 
用 要 求 扫 描 器 生成 分 类 的 字 ， 而 当 它 识别 出 代码 的 各 语法 子 成 份 时 ， 调 用 上 下 文 相 关 分 析 。 这 些 不 同 的 
分 析 器 组 合 在 一 起 形成 编译 器 的 前 端 ， 正 如 在 图 1-1 或 每 一 章 开 始 的 图 解 所 示 的 那样 。 

把 微 语法 从 语法 中 分 离 出 来 能 够 在 以 下 三 个 方面 简化 编译 器 : 

1) 用 于 语法 分 析 器 中 的 语法 描述 是 用 字 和 语法 范畴 写成 的 ， 而 不 是 用 字母 、 数 字 和 空格 。 这 就 使 
得 语法 分 析 器 可 以 忽视 诸如 吸收 多 余 的 空格 、 换 行 和 注释 这 样 的 无 关 问 题 。 这 些 问题 被 隐藏 在 扫描 器 的 
内 部 ， 在 那里 它们 可 以 得 到 清楚 而 有 效 的 处 理 。 : 

2) 扫描 器 构建 几乎 可 以 完全 自动 化 。 我 们 用 形式 表 记 法 对 词法 规则 编码 ， 并 将 其 供给 扫描 器 生成 
器 。 其 结果 是 为 语法 分 析 器 生成 输入 的 可 执行 程序 。 基 于 高 级 描述 所 生成 的 扫描 器 是 高 效 的 。 

3) 被 移入 扫描 器 的 规则 使 语法 分 析 器 变 小 。 语 法 分 析 比 扫描 更 困难 ; 语法 分 析 器 的 大 小 随 着 文法 
的 增长 而 增长 。 因 为 构建 语法 分 析 器 需要 程序 员 更 直接 的 努力 ， 缩 小 语法 分 析 器 将 减少 编译 设计 者 的 

工作 。 

最 后 ， 优 秀 的 扫描 器 比 优秀 的 语法 分 析 器 的 额外 开销 更 少 (以 对 于 每 个 输入 符号 所 需 执行 的 指令 为 
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标准 )。 扫 描 器 把 字符 收集 起 来 形成 字 ， 使 得 语法 分 析 器 能 够 把 每 个 字 当 作 一 个 符号 处 理 。 这 样 的 做 法 
减少 了 语法 分 析 器 必须 处 理 的 字 的 数量 。 

本 章 考察 识别 字符 串 中 的 字 并 识别 每 个 字 的 语法 范畴 的 技术 。 我 们 展示 如 何 简明 地 描述 程序 设计 语 
言 中 的 字 ， 给 出 从 这 些 描 述 直 接 获 得 扫描 器 的 方法 。 最 后 ， 我 们 还 将 给 出 一 些 例子 来 展示 使 识别 字 和 分 
类 字 的 任务 复杂 化 的 语言 设计 。 


2.2 识别 字 


当 描 述 识别 字 的 算法 时 ， 按 字符 给 出 的 公式 有 时 可 以 使 事情 变 得 清晰 。 对 于 简单 的 算法 ， 代 码 的 结 
构 能 够 展现 出 潜在 的 一 些 问题 。 考 虑 识别 字 fee 的 问题 。 假 设 有 例 行 程序 WextChar， 它 返回 下 一 个 字符 。 
这 个 识别 fee 的 代码 可 能 如 下 面 的 片段 : 
c + NextChar() 
if (C# 'f') 
then do something else 
else 
c + NextChar() 
if(c# 'e') 
then do something else 
else 
c + NextChar() 
if (C# 'e') 
then do something else 
. else report success 
这 一 代码 测试 f 后 面 跟着 一 个 e 再 跟着 一 个 es。 在 每 一 步 ， 与 相应 字符 匹配 的 失败 导致 这 一 代码 拒绝 这 个 字符 
串 并 做 一 些 其 他 的 事情 。( 如 果 程 序 的 惟一 目标 是 识别 字 fee， 那 么 适宜 的 行为 也 许 是 打印 一 个 错误 信息 或 
返回 失败 。 正 如 我 们 将 看 到 的 那样 ， 扫 描 器 很 少 只 识别 一 个 字 ， 所 以 在 此 我 们 不 明确 给 出 “出 错 ” 处 理 。) 
这 一 简单 的 代码 片段 对 每 一 个 字符 使 用 if-then-e1se 结 构 执行 一 个 测试 。 我 们 可 以 用 代码 右边 所 
示 的 简单 图 形 来 表示 这 一 代码 片段 。 圆 圈 或 结 点 ， 表 示 计 算 的 抽象 状态 ， 以 0 到 3 编号 。 初 始 状 态 或 开始 
状态 ， 被 标记 为 。 在 本 章 中 ， 除 非 明 确 指出 ，so 都 是 开始 状态 。 终 结 状态 ， 如 本 例 中 的 s;， 以 双 圈 表 
示 。 箭 头 表示 基于 输入 字符 从 一 个 状态 到 另 一 个 状态 的 转换 。 如 果 我 们 从 最 高 点 的 状态 开始 ， 并 看 到 字 
符 f、e 和 e ， 这 一 转换 带 着 我 们 进入 最 下 面 的 状态 。 对 于 其 他 的 输入 ， 例 如 f、i、e ， 将 会 发 生 什 么 
W? f 带 着 我 们 来 到 第 二 个 状态 。 而 {1 与 边 不 匹配 ， 于 是 我 们 停留 在 第 二 个 状态 ， 所 以 我 们 知道 这 个 输入 
字 不 是 fee。 与 fee 不 匹配 的 所 有 情况 都 按 代码 中 的 “做 其 他 事情 ”处 理 。 我 们 可 以 把 这 看 成 是 一 个 到 
错误 状态 的 转换 。 | 
使 用 同样 的 实现 策略 ， 一 个 识别 字 whi1e 的 代码 片段 可 以 编码 成 五 个 嵌 套 的 1Ff-then-e1se 结 构 。 由 
于 这 一 代码 阅读 起 来 很 烦琐 ， 我 们 只 给 出 转换 图 : 


GaORaCaCaG5 
如 果 我 们 在 状态 so 启动 代码 ， 而 且 达 到 了 ss， 我 们 就 知道 这 个 输入 串 的 前 五 个 字符 是 while。 


为 了 误 别 多 个 字 ， 我 们 可 以 填充 代码 中 的 “做 其 他 事情 ”这 部 分 。 同 时 识别 fee 和 fie 的 代码 片段 可 
以 如 下 表示 : 
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这 一 片段 对 f 使 用 一 个 公用 的 测试 ， 这 一 测试 把 状态 从 so 转换 到 s,。 如 果 第 二 个 字符 是 e， 那 么 就 进行 转 
换 s, 一 s,。 反 之 ， 如 果 第 二 个 字符 是 1， 那么 就 进行 转换 s, 一 s,。 最 后 ， 如 果 它 在 状态 ;过 到 一 个 e。， 那 么 
就 进行 转换 : s,sss。 在 状态 看 到 e 导 臻 转换 s,s;。 在 这 一 片段 中 ， 状 态 ss 和 ss 是 终结 状态 。 

如 果 需 要 ， 我 们 可 以 通过 合并 初始 状态 并 且 对 其 他 状态 重新 编号 把 识别 fee 和 fie 的 片段 与 识别 while 
的 片段 结合 起 来 。 这 一 结合 产生 如 下 转换 图 : 





现在 ，so 有 相对 于 f 和 w 的 两 个 转换 ， 而 且 有 三 个 终结 状态 。 当 在 任意 状态 遇 到 了 一 个 与 它 的 转换 中 的 字 
符 不 匹配 的 输入 字符 时 ， 就 显示 一 个 错误 。 


2.2.1 识别 器 的 形式 


这 些 转换 图 是 需要 实现 的 代码 的 抽象 表示 。 也 可 以 把 它们 看 成 是 称 为 有 穷 自 动机 (finite automaton) 
的 ， 用 于 描述 识别 器 的 形式 数学 对 象 。 一 个 有 穷 自动 机 (FA) 是 由 以 下 元 素 组 成 的 : 状态 的 有 穷 集合 、 
这 些 状态 之 间 的 转换 的 集合 、 字 母 表 、 初 始 状态 (so) 以 及 由 一 个 或 多 个 终结 状态 组 成 的 集合 。 
形式 上 ， 一 个 FA 是 一 个 五 元 组 (S, E, Ô, so Sr), Hp, 
。5 是 一 个 状态 集合 。 这 个 集合 包含 转换 图 中 的 每 个 状态 ， 还 有 一 个 特殊 的 错误 状态 s.。。5 必 须 是 有 
穷 的 。 
。 是 一 个 字母 表 或 识别 器 所 用 的 字符 集合 。 通 常 ， > 是 转换 图 中 的 边 的 标签 的 全 体 所 组 成 的 集合 。 
必须 是 有 穷 的 。 , 
。 Os, c) 是 一 个 两 参数 函数 ， 一 个 参数 是 状态 *ES， 一 个 参数 是 字符 cE2 。 这 个 函数 表示 FA 的 转换 。 
当 FA 处 于 状态 *， 并 看 到 一 个 c 时 ， 下 一 个 状态 转换 成 状态 %s，c)。 
。soE3 是 特定 的 初始 状态 。 
* 3r 是 终结 状态 的 集合 。Sr 是 3 的 子 集 。Sz 中 的 每 一 个 状态 在 转换 图 中 以 双 转 表示 。 
为 了 使 上 述 表述 更 加 具体 ， 让 我 们 回顾 前 一 节 最 后 的 FA ， 这 一 FA 识别 fee 或 fie 或 while。 把 这 个 
FA 变 成 形式 定义 ， 我 们 得 到 如 下 形式 : l 


S= {s0 $1, S2; $3, $4) $5, S6» $7, $8, S9» S10» Se} 


E= {e,f,i,h,1, w} 


f w e ` i e 
5 SoS}, SoSe) S152, S154 $2753, 
= e h i 1 e 
$4755, Sg—>S7, S57 58, Sg > So, Sg 一 Si10 
So = So 
SF = {S3, S5, S10} 


这 个 五 元 组 等 价 于 这 个 FA 的 转换 图 ; 给 定 其 中 一 个 我 们 很 容易 生成 另外 一 个 。 在 某 种 意义 上 ， 转 换 图 
是 相应 FA 的 刻画 图 。 
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如 果 FA 处 于 状态 *， 读 入 字符 c， 且 6 (s，c) 无 定义 ， 则 表明 输入 字符 串 有 错误 。 在 这 种 情况 下 ，6 (s, 
c) 将 返回 一 个 出 错 的 信号 。 我 们 也 可 以 把 这 个 错误 信号 看 成 是 返回 一 个 明确 的 错误 状态 *.， 而 且 假 设 ， 对 
于 任意 的 cc2Z 有 sy。 

一 个 FA 接受 一 个 字符 吝 x 当 且 仅 当 ， 从 状态 so 开始， 字符 串 带 着 FA 通过 一 系列 转换 ， 并 当 整 个 字符 
串 被 用 尽 后 停 在 一 个 终结 状态 。 这 与 我 们 对 转换 图 的 直观 认识 相符 。 对 于 字符 串 fee ， 我 们 例子 中 的 识 
别 器 经 过 soes ，sies，s25。 因 为 asESr， 且 没有 剩余 的 输入 ， 所 以 这 个 FA 接受 这 个 字符 串 fee。 对 于 
字符 串 foe ，EFA 的 行为 就 不 同 了 。 初 始 转换 yo 二? 是 相同 的 。 然 而 在 状态 *; 处 没有 作用 于 o 的 正常 转换 ， 
所 以 6 返回 s.。 

AT SMA, MEA BRAS Ax 2x5 x AR, MAAFA, E, Â, so Sp) 接受 x 当 
ARYA 


6(6(.. .6(6(6(So X1), X2), X3) -- -+Xn-1) Xn) € SF 


直观 上 ， 这 一 表达 式 对 应 于 将 6 反复 作用 于 由 属于 $ 的 状态 * 和 输入 符号 x 组 成 的 序 对 。 基本 情况 是 6(s。， 
x1)， 这 对 应 于 FA 的 初始 状态 。 接 着 ， 通 过 运用 6 所 产生 的 这 一 状态 ， 连 同 x*,， 被 用 作 6 用 于 产生 下 一 个 状 
态 的 输入 ， 依 此 类 推 ， 直 到 所 有 的 输入 都 被 用 尽 为 止 。 最 后 一 次 运用 6 的 结果 还 是 一 个 状态 。 如 果 这 个 
状态 在 Sr 中 ， 那 么 FA 就 接受 zixoxs…xo。 

还 有 另外 两 种 情况 。FA 在 处 理 字符 串 时 ， 也 许 会 遇 到 一 个 错误 。 也 就 是 说 ， 它 也 许 在 状态 过 到 一 
个 字符 x;， 并 发 现 6(s;，x*) 无 定义 。 这 显示 一 个 词法 错误 。 字 符 串 zixzzx… 交 不 是 这 个 FA 所 接受 的 语言 
的 任意 合法 字 的 有 效 前 级 。 另 外 ， 这 个 FA 也 许 到 达 x,， 处 理 它 ， 但 停 在 一 个 非 终结 状态 。 在 这 种 情况 下 ， 
这 个 输入 字符 串 是 FA 所 接受 的 某 个 字 的 真 前 级 。 同 时 ， 这 也 显示 一 个 错误 ， 并 应 报告 给 终端 用 户 。 


2.2.2 识别 更 复杂 的 字 


很 容易 把 前 面 的 fee 的 识别 器 中 所 展示 的 逐 字 处 理 模 型 扩展 到 处 理 任意 多 个 完整 刻画 的 字 。 那 么 ， 
我 们 怎样 使 用 这 样 的 识别 器 识别 一 个 数 呢 ? 对 于 特殊 的 数 ， 例 如 113.4， 这 很 容易 办 到 。 


1 1 3 e 4 
On OnOnO, 
然而 ， 为 使 这 样 的 识别 实用 ， 我 们 需要 能 够 识别 任意 一 个 数 的 转换 图 (以 及 相应 的 代码 片段 )。 为 
了 简便 起 见 ， 我 们 只 局 限于 对 无 符号 整数 的 讨论 。 一 般 来 说 ， 一 个 整数 或 者 是 0 或 者 是 一 个 由 一 个 或 多 


个 数字 组 成 的 序列 ， 序 列 的 第 一 个 元 素 是 从 1 到 9 的 数字 ， 而 其 他 元 素 是 从 0 到 9 的 数字 。( 这 排除 了 前 导 
F.) 我 们 如 何 画 出 这 一 定义 的 转换 图 呢 ? . 





转换 ws ， 处 理 0 的 情况 。 其 他 路 径 ， 从 % 到 9， 到 9， 等 等 ， 处 理 大 于 零 的 整数 。 然 而 ， 这 一 路 径 给 我 
们 提出 几 个 问题 。 第 一 个 问题 是 ， 它 不 结束 。 这 违背 了 FA 有 有 穷 状态 集合 的 要 求 。 第 二 个 问题 是 ， 开 始 
于 s 的 路 径 上 的 所 有 状态 都 是 等 价 的 : 它们 的 输入 和 输出 转换 上 有 相同 的 标签 ， 而 且 它们 都 是 终结 状态 。 

如 果 我 们 允许 转换 图 包含 循环 ， 那 么 我 们 可 以 显著 简化 这 个 FA。 我 们 可 以 把 从 ss 开始 的 整个 状态 链 
替换 成 从 s, 开 始 返回 到 其 本 身 的 单一 转换 ， 如 下 所 示 : | 





[35] 





上 面 的 转换 图 作为 FA 是 有 意义 的 。 然 而 ， 从 实现 的 观点 看 ， 它 比 前 面 给 出 的 无 环 图 更 复杂 。 我 们 不 能 把 
它 直接 转换 成 一 系列 能 套 的 77-then-e1se 结 构 。 在 转换 图 中 引入 循环 导致 对 循环 控制 流 的 需要 。 我 们 可 
以 用 图 2-1 所 示 的 py7e 循 环 来 实现 上 述 的 转换 图 。 我 们 可 以 用 一 个 表 来 有 效 地 刻画 5: 


S = {so, 51, 82} 
char + NextChar() 


state + So £ = {0,1,2,3,4,5,6,7,8,9} 
while (char # eof and state # Se) 

state — 6(state,char) 0 1-9 

char +- NextChar() 5 So Si, So > S2 | 


. 0-9 
if (state € Sp) S2 > S2 


then report acceptance 
else report failure 


Sr = {51, S2} 





图 2-1 无 符号 整数 识别 器 


通过 修改 这 个 表 ， 我 们 可 以 使 用 相同 的 基本 代码 框架 来 实现 其 他 的 识别 器 。 注意， 上 面 的 表 有 充分 的 
压缩 潜力 。 数 字 1 到 9 的 各 列 是 相同 的 ， 所 以 它们 可 以 只 表示 一 次 。 这 样 就 使 这 个 表 只 有 三 列 : 0、 
1.…9 和 “其 他 "。 仔 细 考 察 这 一 代码 的 框架 可 知 ， 这 一 代码 只 要 进入 状态 .就 会 报告 失败 ， 所 以 它 从 不 
引用 表 中 对 应 于 s. 的 那 一 行 。 实 现 可 以 消除 整个 这 一 行 ， 于 是 原来 的 4 行 11 列 的 表 可 以 换 成 一 个 3 行 3 列 


我 们 也 可 以 开发 接受 带 符号 整数 、 实 数 和 复数 的 FA。 对 于 上 述 每 一 种 情况 ，FA 识 别 字 的 一 个 无 穷 
集合 。 虽然 这 样 的 FA 可 以 看 成 是 识别 器 的 描述 , 但 它们 并 不 是 特别 简明 的 描述 。 为 了 简化 扫描 器 的 实现 ， 
我 们 希望 有 一 个 描述 字 的 词法 结构 的 简明 表 记 法 ， 和 一 整套 把 这 些 描述 转变 成 FA 并 转变 实现 这 个 FA 的 
代码 的 自动 化 技术 。 本 章 其 余 小 节 讨论 这 样 的 表 记 法 和 技术 。 


2.2.3 扫描 器 的 自动 构建 


从 描述 出 发 自动 构建 扫描 器 的 工具 随手 可 得 。 这 些 工 具 的 基本 结构 如 图 2-2 所 示 。 编 译 器 设计 者 为 
工具 提供 一 组 用 来 描述 特定 源 语言 中 各 种 字 的 词法 模式 。 扫 描 器 生成 器 分 析 这 些 模 式 并 产生 一 个 成 为 扫 
描 器 核心 的 识别 器 。 这 个 识别 器 可 能 被 编码 成 一 组 表格 ,或 者 直接 编码 成 可 执行 代码 。 无 论 是 哪 一 种 情 
况 ， 它 都 可 以 从 这 些 模 式 得 到 正确 、 高 效 的 扫描 器 。 因 为 这 些 工 具 生 成 优秀 的 扫描 器 ， 所 以 编译 器 设计 
者 很 少 手工 构建 扫描 器 。 | - 
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图 2-2 自动 扫描 器 生成 
2.3 正则 表达 式 


一 个 有 穷 自动 机 F 接 受 的 字 的 集合 形成 一 个 语言 ， 记 作 L(F)。 这 一 FA 的 转换 图 精确 地 描述 这 个 语言 。 
然而 ， 它 对 我 们 来 说 并 不 直观 。 对 于 任意 的 FA ， 我 们 也 可 以 使 用 称 为 正则 表达 式 (regular expression) 
的 表 记 法 来 描述 它 的 语言 。 

正则 表达 式 (RE) 等 价 于 上 节 所 述 的 有 穷 自 动机 (FA)。( 我 们 将 运用 2.4 节 所 给 的 构造 法 证 明 这 一 
点 。) 简单 的 识别 器 有 简单 的 RE 描述 。 

* 由 单个 字 fee 组 成 的 语言 可 以 用 写成 jee 的 RE 来 描述 。 这 里 ， 彼 此 相 邻 的 两 个 字符 表示 我 们 希望 它 

们 按 书 写 的 顺序 依次 出 现 。 表 达 式 fee 是 这 一 语言 的 一 个 RE。 

* 由 两 个 字 fee 和 while 组 成 的 语言 可 以 写作 fee or while。 为 了 避免 误解 or， 我 们 用 符号 | 表示 or (或 

者 )。 因 此 ， 我 们 把 这 个 RE 写作 fee|while。 

。 由 fee 和 fie 组 成 的 语言 可 以 写作 fee|fie。 也 可 以 写作 flelije。 这 个 RE f(el|i)e 比 fee|fie 更 接近 FA 的 

结构 。 





为 使 上 面 的 描述 更 具体 ， 考 虑 程序 设计 语言 中 的 一 些 例子 。 标 点 符号 ,例如 冒号 、 分 号 、 逗 号 和 各 种 括 


号 ， 可 以 用 它们 的 字符 形式 来 表示 。 因 此 ， 我 们 可 以 得 到 典型 程序 设计 语言 的 如 下 词法 描述 RE: 


同样 地 ， 关 键 字 有 如 下 简单 的 RE: 
if while this integer instanceof 
为 了 模型 化 更 复杂 的 结构 ， 例 如 ， 整 数 或 标识 符 ， 我 们 需要 能 够 刻画 FA 中 循环 边 的 本 质 的 表 记 法 。 


无 符号 整数 的 FA 有 三 个 状态 ， 一 个 初始 状态 s。， 对 应 于 惟一 整数 0 的 终结 状态 s; 和 对 应 于 所 有 其 他 整 
数 的 终结 状态 *。 
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这 一 FA 的 优点 所 在 是 ， 对 于 每 一 个 额外 的 数字 ， 状 态 s 出 发 的 转换 都 返回 其 本 身 。 状 态 ss 把 描述 折 
登 回 其 本 身 ， 生 成 一 个 从 现存 的 无 符号 整数 得 到 新 无 符号 整数 的 规则 : 把 另外 一 个 数字 添加 到 现存 整数 
的 右 侧 。 这 一 规则 的 另 一 种 刻画 是 ， 一 个 无 符号 整数 或 者 是 0， 或 者 是 一 个 非 0 数 后 面 跟着 零 个 或 多 个 数 
字 。 为 了 刻画 这 一 FA 的 本 质 ， 我 们 需要 对 “ 零 个 或 多 个 出 现 ” 的 概念 给 出 一 个 表 记 法 。 对 于 RE x， 我 们 
用 x 来 表示 “x 的 零 个 或 多 个 出 现 。” 我 们 称 * 运 算 符 为 克 林 闭 所 (Kleene closure) 或 简称 闭 包 (closure). 
使 用 闭 包 运算 符 ， 我 们 把 这 个 FA 对 应 的 RE 记 作 0|(1|213|4|51617|819) (0|1|2/3|4|5|6|7|8|9)" 


2.3.1 正则 表达 式 的 定义 


为 了 用 更 严格 的 方式 使 用 正则 表达 式 ， 我 们 必须 更 加 形式 化 地 定义 它们 。 一 个 正则 表达 式 描述 某 个 
字母 表 Z 上 的 字符 串 ， 加 上 表示 空 字 符 的 es, 组 成 的 一 个 集合 。 我们 称 这 个 字符 串 集 合 为 语言 (language )。 
给 定 正则 表达 式 ~， 我 们 把 "描述 的 语言 记 作 Z(。 正 则 表达 式 由 下 面 三 个 基本 操作 构筑 而 成 : 

(1) 选择 (alternation ) 

两 个 集合 R 和 5 的 选择 ， 或 并 ， 记 作 RIS， 定 义 为 {slsER 或 ;ES}。 

(2) 连接 (concatenation) 

两 个 集合 R 和 5 的 连接 ， 记 作 RS， 定 义 为 {silsER 且 1ES}。 有 了 时 我 们 把 RR 写作 R*?， 这 是 集合 R 与 其 本 身 
的 连接 ,同样 ， 把 RRR (WRR) BER’. 

(3) W é& (closure) 

集合 R 的 克 林 闭 包 ， 记 为 RR ， 定 义 为 U0”R'。 也 就 是 说 ， 先 让 集合 R 与 其 本 身 经 过 零 次 或 多 次 连接 ， 
然后 对 所 有 这 些 结果 取 并 集 。 


| 虚拟 生活 中 的 正则 表达 式 


| 很 多 描述 字符 串 模 式 的 应 用 使 用 正则 表达 式 。 把 正则 表达 式 翻 译 成 代码 的 一 些 早 期 工作 产生 于 
在 文本 编辑 器 的 “寻找 ”指令 中 提供 的 刻画 字符 串 的 灵活 方法 。 从 这 些 早 期 的 工作 开始 ， 这 一 表 记 
法 已 经 在 不 知 不 觉 中 运用 于 不 同 的 应 用 领域 。 

在 Unix 和 很 多 其 他 操作 系统 中 ， 星 号 被 用 作 匹 配 文件 名 的 任意 子 串 的 通配符 。 这 里 ，* 是 正则 


表达 式 2 的 简写 形式 ， 表 示 零 个 或 多 个 来 自 于 合法 字符 组 成 的 完整 字母 表 的 字符 串 。( 因为 很 少 有 


键盘 有 5 键 ， 所 以 这 一 速记 形式 一 直 沿 用 了 下 来 ) 很 多 系统 都 要 使 用 “?” 作 为 与 单一 字符 匹配 的 
grep 类 的 工具 以 及 非 Unix 系 统 中 的 类 似 工具 都 实现 了 正则 表达 式 的 模式 匹配 。( 事实 上 ，grep 
| 是 global regular-expression pattern match and print 的 字 头 缩写 。 ) 
由 于 正则 表达 式 很 容易 书写 而 且 很 容易 理解 ， 它 得 到 日 益 广汉 的 应 用 。 当 一 个 程序 必须 识别 一 
个 固定 的 词汇 时 ， 它 是 一 个 可 选 的 技术 。 它 对 那些 满足 它 的 规则 限制 的 语言 很 有 效 。 正 则 表达 式 很 
容易 翻译 成 可 执行 形式 ; 其 结果 的 识别 器 也 很 快 。 





有 时， 我 们 使 用 R 的 正 闲 包 (positive closure)， 记 作 R*， 定 义 为 U1*R'。 因 为 R' 总 能 写成 RR"， 在 随 
后 的 讨论 中 我 们 忽视 正 闭 包 。 
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使 用 这 三 个 运算 ， 我 们 能 够 如 下 定义 字母 表 > 上 的 正则 表达 式 的 集合 9: 
1) 如 果 aEZ， 那 么 a 也 是 一 个 RE， 表 示 只 包含 a 的 集合 。 
2) a 是 一 个 RE， 表示 只 含 空 字符 串 的 集合 。 
3) 如 果 r 和 s 是 RE， 分 别 表示 集合 L(r) 和 L(s)， 那 么 
(7) 是 一 个 RE， 表 示 和 集合 L(7)， 
rls 是 一 个 RE， 表 示 L(r) 和 L(s) 的 并 或 选择 ， 
rs 是 一 个 RE， 表 示 L(r) 和 L(s) 中 的 字符 串 的 连接 的 集合 ， 
是 一 个 RE， 表 示 L(r) 的 克 林 闭 包 。 
为 了 消除 歧义 性 ， 闭 包 具 有 最 高 优先 权 ， 其 次 是 连接 ， 然 后 是 选择 。 
作为 一 个 便利 的 简 记 法 ， 我 们 用 省 略 号 连接 第 一 个 元 素 和 最 后 一 个 元 素来 描述 字符 的 范围 。 为 了 使 
这 一 简写 更 突出 ， 我 们 总 是 使 用 一 对 方 括号 把 它 括 起 来 。 因 此 ，[0...9] 表 示 十 进 制 数字 的 集合 。 它 与 正 
则 表达 式 (0/1/2/3141516171819) 描述 同一 个 集合 。 


2.3.2 例子 


本 章 的 目标 是 展示 如 何 使 用 形式 技术 来 自动 构造 高 质量 扫描 器 ， 以 及 如 何 用 这 种 形式 对 程序 设计 语 
言 的 微 语 法 结构 编码 。 在 展开 我 们 的 讨论 之 前 ， 在 此 我 们 列 出 来 自 于 实际 程序 设计 语言 的 一 些 例 子 。 

1) Algol 和 它 的 后 代 定义 标识 符 为 一 个 字母 字符 后 面 跟随 着 零 个 或 多 个 字母 或 数字 字符 。 如 果 我 们 
假设 所 用 的 字母 都 是 小 写字 母 S， 就 可 以 用 RE [a...z] ({a...z]|[0...9)) 来 描述 标识 符 的 定义 。 很 多 语言 
标识 符 中 还 允许 出 现 若 干 特殊 的 字符 ， 例 如 下 划 线 (_)、 百 分 号 (%) 或 “与 ”符号 (&)。 

2) 无 符号 整数 可 以 描述 成 0 或 非 0 数字 后 面 跟随 零 个 或 多 个 数字 。RE 0|[1...9][0...9] "更 加 简明 。 在 
实践 中 ,很 多 实现 都 允许 把 一 个 更 大 的 字符 串 类 作为 整数 ， 承 认 语 言 [0.….9]*。 

3) 实数 比 整 数 更 复杂 。 一 个 实数 可 能 被 描述 成 (0|[1.….9][0.….9]")(s|.[0.;.9]”))。 这 一 表达 式 的 第 一 部 分 
是 整数 的 RE。 余 下 的 部 分 生成 空 字符 串 或 一 个 十 进 制 小 数 点 后 面 跟随 零 个 或 多 个 数字 。 

程序 设计 语言 通常 把 这 一 形式 扩展 成 科学 表 记 法 ， 可 以 用 RE (0/[1...9](0...9]")(.[0...9] "|e)E(+| 一 
|a)(Ol[1...9][0...9]) 来 描述 。 这 一 RE 刻画 一 个 实数 ， 后 面 跟随 一 个 E， 后 面 跟随 一 个 描述 指数 的 整数 。 

4) 被 引用 字符 串 有 其 自身 的 复杂 性 。 在 多 数 语 言 中 ， 任 何 一 个 字符 都 可 以 出 现在 字符 串 的 内 部 。 
这 些 字符 包括 空格 、 制 表 符 、 换 行 符 ， 甚 至 包括 被 用 于 定 界 字符 申 的 字符 。 为 了 表示 集合 {了 - c} ， 我 们 
使 用 表 记 法 [^c]， 它 取 自 于 扫描 器 生成 器 1ex。C 中 的 字符 串 可 以 描述 成 "[^"]"。 

诸如 C 语 言 中 表示 换行 的 \n 和 表示 "的 \" 这 样 的 转 义 字符 简化 了 字符 串 的 处 理 。 描 述 转 义 字符 的 另外 
一 个 方法 是 写 两 个 所 涉及 的 字符 。 因 此 ， 为 了 把 字符 " 放 入 字符 串 中 ， 程 序 员 将 键入 ""。 这 使 描述 字符 
常量 的 RE 复杂 化 。 | 

5) 注释 以 若干 形式 出 现 。 有 些 语言 允许 诸如 # 或 // 这 样 的 定 界 符 ， 表 示 从 定 界 符 一 直到 当前 行 的 结 
束 为 注释 。 这 导致 形 如 /fA\n] 的 RE， 其 中 \n 表 示 换 行 符 。 其 他 语言 以 不 同 的 定 界 符 作 为 注释 的 起 点 和 
终点 。Pascal 语 言 使 用 [和 ] 作 为 注释 的 定 界 符 ， 它 导致 形 如 {[^}]} 的 RE。Java 语 言 和 C 语 言 允 许 二 字符 
定 界 符 /* 和 */; 这 导致 一 个 更 复杂 的 RE。 

以 上 各 例子 都 表示 字 的 无 穷 集 合 。 对 字 集 合 的 限制 通常 导致 更 长 、 更 复杂 的 RE。 例 如 ， 某 些 语 言 


日 原 书 把 2 和 3) 调 换 了 位 置 。 作 者 的 定义 不 容许 写 诸如 ds 这样 的 正则 表达 式 ， 而 这 样 的 正则 表达 式 有 时 是 很 

: “方便 的 。 见 下 一 个 译 者 注 和 后 文 。 一 一 译 者 注 

日 ”各 果 程序 设计 语言 忽视 大 小 写 ， 那 么 扫描 器 可 以 把 所 有 字母 都 改 成 小 写字 母 。 如 果 程 序 设计 语言 是 大 小 写 
敏感 的 ， 那 么 相应 的 RE 也 就 变 得 更 复杂 了 。 
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限制 标识 符 的 长 讼 。 这 导致 比 以 上 正则 表达 式 更 长 的 正则 表达 式 。 例 如 ，Algol 这 样 的 语言 把 标识 符 的 
最 大 长 度 限 制 为 6 个 字符 ， 这 导致 如 下 的 RES: 
[a...z]({a...z]|[0...9D(fa...z]|{0...9])([a...z]|[0...9DC[a...zH[0.:.9D[a...z]l[0...9) 
它 所 对 应 的 FA 的 状态 比 无 长 度 限 制 标 识 符 的 FA 的 状态 要 多 。 我 们 可 以 引入 一 个 有 限 闭 包 c* 的 表 记 法 
来 描述 c 的 0 个 到 k 个 拷贝 。 这 样 ， 我 们 就 可 以 将 上 面 六 字符 标识 符 的 RE 写成 {a.…z]([a.…z]|[0..:9]);。 它 简 
化 并 缩短 这 一 正则 表达 式 ， 但 是 对 相应 的 FA 没有 起 到 简化 的 作用 。 
试图 使 RE 更 具体 可 能 会 导致 复杂 的 表达 式 。 例 如 ， 考 虑 这 样 的 例子 : 典型 汇编 语言 中 的 寄存 器 描 


述 器 是 由 字母 r 后 面 跟随 着 一 个 小 整数 组 成 的 。 尽 管 ILOC 的 寄存 器 名 字 的 描述 是 RE r[0...9]+， 它 容许 寄 


存 器 名 字 的 无 穷 集 合 。 相 应 的 识别 器 如 下 所 示 : 


ou 


这 个 识别 器 接受 r29 而 拒绝 S29。 它 也 接受 r99999， 即 使 目前 不 存在 100 000 个 寄存 器 的 计算 机 。 
然而 ， 在 一 台 真 实 的 计算 机 上 ， 寄 存 器 名 集合 受到 严格 的 限制 ， 如 32、64 或 128 个 寄存 器 。 我 们 能 
够 构建 这 个 寄存 器 描述 器 的 一 个 更 精确 的 RE， 而 不 是 编写 将 每 一 个 寄存 器 名 字 转 换 成 一 个 整数 ， 然 后 
看 它 是 否 在 0 到 31 的 范围 的 代码 。 下 面 是 一 个 这 样 的 RE: 
roll2)([0.9]|e1(41546718|9)1(3(0flle)7) 


这 一 表达 式 的 构造 很 巧妙 ， 它 接受 r0、r29 和 Fr31， 而 不 接受 r32 或 r99999。 它 可 以 用 于 定义 寄存 器 
名 字 的 语法 范畴 。 它 刻画 一 个 小 语言 ， 将 寄存 器 限于 0 到 31， 而 且 对 于 一 位 数 的 寄存 器 名 可 以 加 入 一 个 
前 导 零 。 相 应 的 FA 如 下 所 示 : 





哪个 FA 更 好 呢 ? 两 个 FA 都 对 每 一 个 输入 字符 做 一 次 转换 。 因 此 ， 二 者 都 做 同样 次 数 的 转换 ， 即 使 
复杂 的 FA 检查 更 复杂 的 微 语法 描述 。 复 杂 的 FA 有 更 多 的 状态 和 更 多 的 转换 ， 所 以 ， 它 的 表示 需要 更 大 - 
的 空间 。 然 而 本 质 上 ， 它 们 的 操作 代价 是 相同 的 。 

这 是 非常 关键 的 : FA 的 操作 代价 与 输入 字符 串 的 长 度 成 正比 ， 而 不 与 生成 识别 器 的 正则 表达 式 的 长 
度 或 复杂 性 成 正比 。 增 加 正则 表达 式 的 复杂 性 能 够 增加 相应 FA 的 状态 数目 。 从 而 增加 表示 这 个 FA 所 需 
要 的 空间 和 自动 构建 它 的 代价 ， 但 是 操作 的 代价 仍然 是 每 个 输入 字符 一 个 转换 。 

我 们 能 够 改进 寄存 器 描述 器 的 表述 吗 ? 这 个 RE 既 复 杂 又 不 直观 。 另 外 一 个 RE 如 下 所 示 : 

rO|r00|r1|r01|r2{r02|r3|r03|r4|r04|r5|r05|r6|r06|r7|r07|r8|r08|r9|r09|r10|r11|r12| 
r13|r14|r15|r16|r17|r18|r19|r20|r21 |r22|r23|r24|725|r26|r27|728|729|730|r3 1 


O 实际 上 ， 这 一 正则 表达 式 表示 的 是 长 度 刚好 为 6 的 标识 符 的 集合 ， 长 度 最 大 为 6 的 标识 符 的 集合 应 该 用 诸 
#la...z]({a...z]|[0...9}le)((a...z]|[0...9}e)(fa...z]|[0...9}/e)([a...z]/(0...9]/e)({a...z]|[0...9]le) 这 样 的 正则 表达 式 
来 表示 。 一 一 译 者 注 f 
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这 个 表达 式 在 概念 上 更 简单 ， 但 是 比 原来 的 表达 式 更 长 些 。 导 致 FA 仍然 对 每 个 输入 符号 做 一 个 转换 。 因 
此 ， 如 果 我 们 能 够 阻止 空间 需求 增加 过 快 ， 那 么 我 们 也 许 更 倾向 于 这 个 寄存 器 描述 器 ， 因 为 它 更 清晰 、 
明了 。 


2.3.3 ”RE 的 性 质 


可 以 用 RE 表示 的 语言 的 集合 称 为 正则 语言 (regular languages) 集合 。 正 则 语言 已 得 到 深入 研究 ; 
它们 有 很 多 有 趣 而 重要 的 性 质 。 其 中 一 些 性 质 在 生成 扫描 器 中 起 着 重要 的 作用 。 

正则 表达 式 在 很 多 运算 下 封闭 ， 也 就 是 说 ， 如 果 我 们 对 一 个 RE 或 一 组 RE 运用 一 个 运算 ， 那 么 其 结 
果 仍 旧 是 一 个 RE。 显 然 的 例子 是 连接 、 选 择 和 闭 包 运算 。 两 个 RE，x 和 y 的 连接 是 xy。 它 们 的 选择 是 xly。。 
x 的 克 林 闭 包 是 x 。 所 有 这 些 结果 都 符合 RE 的 定义 。 

RE 是 封闭 的 事实 在 使 用 RE 构建 扫描 器 的 工作 中 起 着 至 关 重 要 的 作用 。 假 设 对 于 源 语 言 中 的 每 一 个 
语法 范畴 我 们 都 有 RE， 这 些 RE 为 ac，a，4…，w。 我 们 能 够 使 用 选择 把 这 些 RE 连 结 起 来 形成 表示 所 有 
有 效 字 构成 的 语言 的 RE ailaslas|…|a,。 因 为 RE 在 选择 运算 下 是 封闭 的 ， 因 此 我 们 的 结果 一 定 是 一 个 RE。 
我 们 对 单一 语法 范畴 的 RE 所 能 做 的 任何 事情 都 同样 可 以 运用 到 这 个 语言 的 所 有 字 的 集合 的 RE 上 。 

连接 的 封闭 性 使 得 我 们 可 以 将 简单 的 RE 连接 起 来 构建 复杂 的 RE。 这 一 性 质 似乎 很 显然 而 不 重要 。 
然而 ， 它 使 我 们 可 以 系统 地 将 多 个 RE 组 合 起 来 。 因 此 ， 封 闭 性 确保 : 只 要 a 和 4b 都 是 RE， 那 么 ab 也 是 RE。 
因此 ， 任意 可 以 运用 Ta 或 5 上 的 技术 也 可 以 运用 ab 上 ; 这 包括 从 RE 自动 生成 识别 器 的 构建 ， 


程序 设计 语言 与 自然 语言 的 比较 


词法 分 析 凸 现 了 程序 设计 语言 不 同 于 诸如 英语 或 中 文 等 自然 语言 的 一 个 微妙 之 处 。 在 自然 语言 
| 中 ,单词 的 表示 ， 即 它 的 拼写 或 它 的 象形 图 与 它 的 含义 之 间 的 关系 不 是 显然 的 。 在 英语 中 ，are 是 一 
| 个 动词 而 art 则 是 一 个 名 词 ， 尽 管 它们 仅 在 最 后 一 个 字符 不 同 。 另 外 ， 并 非 所 有 字符 的 组 合 都 是 合法 
的 。 例 如 ，arz 与 are 及 art 仅 有 微小 的 不 同 ， 但 是 它 不 是 正常 英语 用 法 中 的 单词 。 | 
英语 扫描 器 可 以 运用 基于 FA 的 技术 来 识别 潜在 的 单词 ， 因为 所 有 英语 单词 来 自 于 一 个 受 限 字母 | 
| 表 。 然 而， 必须 通过 查阅 某 个 字典 来 看 这 个 潜在 的 单词 是 否 是 真实 的 单词 。 如 果 这 个 单词 能 归 类 为 | 
一 个 词性 ， 那 么 这 次 查找 就 可 以 解决 归 类 问题 。 然 而 ， 很 多 英语 单词 可 以 归 类 若干 个 词性 。 这 样 的 | 
例子 包括 buoy 和 stress; 二 者 都 可 以 是 动词 或 名 词 。 对 于 这 样 的 单词 ， 其 词性 依赖 于 上 下 文 。 在 某 些 | 
情况 下 ， 理 解 语 法 内 容 足 以 将 这 个 单词 分 类 。 而 在 另外 一 些 情况 下 ， 为 了 归 类 ， 我 们 需要 理解 我 们 | 
| 所 讨论 的 单词 的 含义 以 及 它 的 上 下 文 的 含义 。 | 
| 相反 ， 程 序 设计 语言 中 的 字 几 乎 总 是 通过 词法 来 描述 的 。 因 此 ， (0.…9)(0.…9) 中 的 任意 字符 串 是 | 
正 整数 。[a.…z]([a…z]|[0.…9]) 中 的 任意 字符 串 是 Algol 标 识 符 。 字 符 串 arz 与 are 同 样 合法 ， 不 需要 通 | 
过 查找 来 证 实 它 的 合法 性 。 固 然 ， 某 些 标识 符 也 许 被 作为 关键 字 而 保留 起 来 。 然 而 ， 这 些 例外 情况 
同样 可 以 用 词法 来 描述 。 不 需要 上 下 文 。 
在 程序 设计 语言 的 设计 中 ， 这 是 一 个 有 意 的 决定 。 使 一 个 拼写 表示 惟一 词性 的 做 法 简化 扫描 、 
| 简化 分 析 ， 而 且 显 然 并 没有 丧失 语言 的 表达 能 力 。 某 些 语 言 允 许字 带 有 双重 的 词性 ， 例 如 ，PL/I 没 
有 保留 关键 字 。 后 来 设计 的 语言 放弃 了 这 一 观点 ， 因为 这 一 复杂 化 超出 了 它 所 能 带 来 的 语言 灵活 性 。 | 





克 林 闭 包 的 封闭 性 使 得 我 们 能 够 描述 特殊 种 类 的 带 有 有 限 模 式 的 无 穷 集合 。 这 是 非常 重要 的 ; 无 限 
的 模式 对 于 一 个 实现 器 是 毫 无 用 处 的 。 因为 C 语 言 的 标识 符 规则 不 限定 名 字 的 长 度 ， 这 一 规则 允许 字 


O 原 书 说 的 是 Algol 标 识 符 ， 然 而 事实 上 ，Algol 限 制 标识 符 的 长 度 不 大 于 6， 不 符合 这 里 的 说 明 。 一 一 译 者 注 
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的 无 穷 集合 。 这 使 程序 员 可 以 写 出 任意 的 有 限 长 度 的 标识 符 。 闭 包 人 允许 我 们 不 用 指定 最 大 长 度 就 可 以 写 
出 这 样 的 集合 的 简明 规则 。 | : 

下 一 节 将 给 出 如 何 构建 识别 用 RE 来 描述 的 语言 的 FA， 同 时 给 出 构建 FA 接受 的 语言 的 RE 的 算法 。 这 
些 构造 法 结合 在 一 起 建立 RE 和 FA 之 间 的 等 价 性 。RE 在 选择 、 连 接 和 闭 包 下 封闭 的 事实 对 这 些 构 建 至 关 
重要 。 

RE 和 FA 之 间 的 等 价 性 也 表明 另 一 种 封闭 性 质 。 例 如 ， 给 定 一 个 FA， 我 们 可 以 构建 识别 所 有 不 在 
L(FA) 中 的 字 w 的 FA， 并 称 其 为 L(FA) 的 补 。 为 了 构建 这 个 补 的 FA， 我 们 可 以 令 所 有 非 终结 状态 为 终结 
状态 ， 而 所 有 终结 状态 为 非 终结 状态 。 这 表明 ， 我 们 可 以 在 我 们 的 正则 表达 式 的 表 记 法 中 加 入 求 补 运 算 
符 而 不 改变 正则 表达 式 的 性 质 。 很 多 使 用 正则 表达 式 的 系统 都 有 这 样 的 运算 符 。 


2.4 从 正则 表达 式 到 扫描 器 以 及 从 扫描 器 到 正则 表达 式 


我 们 研究 有 穷 自动 机 的 目标 是 从 一 组 正则 表达 式 出 发 自动 地 构建 可 执行 扫描 器 。 本 节 阐 述 把 RE 转 
化 成 FA 的 构造 法 ， 这 个 构造 法 适合 于 直接 实现 。 我 们 还 将 益 述 构建 FA 接受 的 语言 所 对 应 的 RE 的 算法 。 
图 2-3 展 示 出 所 有 这 些 构造 法 之 间 的 关系 。 


Kleene 构 造 法 
扫描 器 
的 代码 
RE DFA 最 小 化 DFA 
i 子 集 构 造 法 
Thompson 
构造 法 NFA 


图 2-3 构造 法 的 循环 关系 


为 了 给 出 这 些 构造 法 ， 我 们 首先 要 介绍 两 个 FA 子 类 ， 非 确定 性 (nondeterministic) FA (NFA) 和 
确定 性 (deterministic) FA(DFA)。2.4.1 节 介绍 NFA 并 论述 其 与 DFA 的 不 同 。 然 后 ， 我 们 通过 三 个 步骤 给 
出 这 一 构造 法 。Thompson 构 造 法 从 RE 构筑 FA。 这 一 子 集 构造 法 构筑 模拟 NFA 的 DFA。2.4.4 节 给 出 的 
Hopcroft 算 法 最 小 化 DFA。2.4.5 给 出 描述 DFA 接 受 的 语言 相对 应 的 RE 的 Kleene 算 法 。 这 一 算法 在 通过 完 
成 图 2-3 中 构造 法 的 循环 关系 建立 FA 与 RE 间 的 等 价 性 中 起 着 重要 作用 。2.5 节 给 出 若干 实现 FA 的 方案 。 


2.4.1 非 确 定性 有 穷 自 动机 


根据 正则 表达 式 的 定义 ， 空 字符 串 e 为 一 个 RE。 我 们 前 面 构建 的 FA 中 都 不 包含 :但 是 有 些 RE 却 包 
含 e。 在 FA 中 扮演 着 什么 样 的 角色 昵 ? 我 们 可 以 对 e 使 用 转换 来 把 FA 结合 起 来 构造 对 应 于 更 复杂 的 RE 的 
FA。 例 如 ， 假 设 有 对 应 于 RE m 和 n 的 FA， 分 别称 作 FA. 和 FA,。 


我 们 可 以 如 下 构造 mn 对 应 的 FA: 加 入 从 FA。 的 终结 状态 到 FA, 的 初始 状态 的 对 < 的 转换 ， 对 状态 重新 
标号 ， 并 以 FA, 的 终结 状态 为 新 FA 的 终结 状态 。 
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On OnOn 
由 于 对 的 转换 ， 我 们 必须 稍 加 修改 接受 的 定义 ， 以 允许 在 输入 字符 串 中 任意 两 个 字符 之 间 存 在 一 个 或 多 
个 上 转换 。 例 如 ， 在 状态 "处 ，FA 不 读 取 输 入 就 可 进行 转换 "2s。 这 是 一 个 较 小 的 变化 ， 它 似乎 很 直观 。 
通过 观察 ， 我 们 可 以 看 到 ， 状 态 *9 和 sy 可 以 组 合 起 来 ，s 上 的 转换 可 以 消去 。 i 


OORO. 


用 e 转 换 把 两 个 FA 合并 起 来 会 使 FA 的 运行 模型 复杂 化 。 考 虑 语言 和 ap 的 FA。 


a 
b A 
A Ok OnO 
我 们 可 以 用 上 转换 把 它们 合并 起 来 形成 对 应 于 a ab FA 


(ja 

OnOnOn 

实际 上 ， 对 于 这 个 FA， 由 于 转换 从 so 出 发 对 字母 a 有 两 个 不 同 的 转换 。 它 可 以 取 转 换 s0so 或 两 个 转换 
5 人 51 和 35。 哪个 转换 是 正确 的 呢 ? 考虑 字符 串 aab 和 ab。 这 个 FA 接受 这 两 个 字符 串 。 对 于 aab ，FA 
HERP Bi sy 2959, Sos, Ss, ARs: >s, X Fab, CHB Rss, ssr, 52°55. 

正如 这 两 个 字符 串 所 示 ， 从 so 出 发 对 a 的 正确 转换 取决 于 跟 在 a 后 面 的 字符 。 在 每 一 步 ，FA 检 查 当 前 的 
字符 。 它 的 状态 编码 当前 字符 的 左上 下 文 ， 也 就 是 它 已 经 处 理 过 的 那些 字符 。 因 为 FA 必须 在 检查 下 一 个 
字符 之 前 完成 转换 ， 因 此 诸如 so 这 样 的 状态 违背 我 们 的 按 序 算法 的 行为 的 概念 。 含 有 诸如 so 这 样 的 对 一 个 
字符 有 多 个 转换 的 状态 的 FA 称 作 非 确定 性 有 穷 自动 机 (nondeterministic finite automaton，NFA )。 与 此 对 
应 ， 在 每 一 个 状态 都 有 惟一 字符 转换 的 FA 称 为 确定 性 有 穷 自动 机 (deterministic finite automaton, DFA). 

为 了 使 NFA 有 意义 ， 我 们 需要 描述 它 的 行为 的 一 组 新 的 规则 。 基 于 历史 原因 ， 对 NEFA 的 行为 有 两 个 
不 同 的 模型 。 

1) 每 当 NFA 遇 到 非 确定 的 选择 时 ， 如 果 存 在 导致 输入 字符 串 进入 接受 状态 的 转换 ， 那 么 它 就 选择 
这 个 转换 。 这 一 使 NFA 带 有 智能 的 模型 很 有 吸引 力 ， 因 为 (在 表面 上 ) 它 保留 了 DFA 优 秀 的 接受 机 制 。 

2) 每 当 NFA 遇 到 非 确定 的 选择 时 ，NFA 复 制 自身 以 跟踪 每 一 个 可 能 的 转换 。 因 此 ， 对 于 给 定 的 输 
人 字符 ， 通 过 复制 ，NFA 处 于 特定 的 状态 集合 。 我 们 称 这 样 的 状态 集合 为 NFA 的 格局 (configuration). 
当 NFA 到 达 一 个 格局 刚好 耗 尽 了 输入 ， 而且 一 个 或 多 个 复制 达到 终结 状态 时 ， 它 接受 这 个 字符 申 。 尽 管 
这 一 模型 相对 比较 复杂 ， 但 是 这 个 模型 跟踪 通过 NEFA 的 转换 图 的 各 个 路 径 ， 直 到 成 功 或 耗 尽 所 有 路 径 。 

在 以 上 两 个 模型 中 ， 有 必要 形式 化 NAF 的 接受 标准 。 给 定 NFA(S，5 ，6，so，Sr) 和 输入 字符 串 
XixzX3…xk， 当 且 仅 当 在 转换 图 中 至 少 存在 一 条 开始 于 s。， 结 束 于 某 个 stE5: 的 路 径 ， 使 得 沿 着 这 一 路 径 的 
边 的 标签 构成 输入 字符 串 (忽略 标签 为 e 的 边 ) 时 ， 该 NFA 接 受 该 字符 囊 。 换 名 话说， 第 ;条 路 径 的 标签 
必须 是 Xx。 这 一 定义 同时 符合 NFA 的 两 个 行为 模型 。 

本 节 所 给 构造 法 的 循环 关系 的 一 个 结论 是 NFA 和 DFA 等 价 。DFA 是 NFA 的 特殊 情况 。 因 此 ，NFA 至 
少 与 DFA 一 样 功能 强大 。 任 意 的 NFA 可 以 用 DFA 模 拟 : 这 是 2.4.3 节 中 的 子 集 构造 法 所 确立 的 事实 。 它 的 
思想 很 简单 ; 但 构造 法 要 稍稍 复杂 一 些 。 l 

考虑 当 一 个 NFA 到 达 输 入 字符 串 中 的 某 个 点 时 的 状态 。 在 NFA 行 为 的 第 二 个 模型 下 ， 这 时 NEFEA 有 有 
限 个 复制 。 相 应 的 格局 的 数目 是 有 界 的 ; 对 于 每 一 个 状态 ， 格 局 或 者 包含 处 于 这 个 状态 的 复制 ， 或 者 不 
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包含 这 样 的 复制 。 如 果 NEFA 有 m 个 状态 ， 它 最 多 产生 2" 个 格局 。 

为 了 模拟 NFA 的 行为 ， 我 们 需要 一 个 对 NEFA 的 每 一 个 格局 都 有 一 个 对 应 状态 的 DFA。 因 此 ，DFA 的 
状态 比 原来 的 NFA 的 状态 是 指数 增加 。 我 们 把 N 的 所 有 子 集 记 作 2 ， 称 为 N 的 得 和 集 。 因 此 ，Sopm 与 2.28 一 
样 大 。 注 意 ，2spm 是 有 限 的 。 另 外 ， 这 个 DFA 仍 然 对 每 个 输入 符号 做 一 个 转换 。 因 此 ， 模 拟 NEA 的 这 个 
DEFA 的 运行 时 间 仍然 按 输入 字符 长 度 线性 增加 。 使 用 DFA 模 拟 NFA 存 在 空间 问题 ， 但 不 存在 时 间 问 题 。 

因为 NEA 和 DFA 是 等 价 的 ， 我 们 应 该 可 以 构造 wab 对 应 的 DFA。 下 面 是 一 个 这 样 的 PFA 。 


| 


注意 ，a"ab 描 述 的 字 的 集合 与 cab 描 述 的 集合 相同 。 这 一 FA 的 结构 与 RE aa"b 的 结构 类 似 。 
2.4.2 正则 表达 式 到 NFA: Thompson 构 造 法 


从 RE 出 发 实现 扫描 器 的 第 一 步 是 从 这 个 RE 得 到 相应 的 NFA。Thompson 构 造 法 依据 一 个 直截了当 的 
想法 。 它 有 一 个 构建 对 应 于 单一 字母 RE 的 NFA 模 板 ， 以 及 刻画 RE 运算 符 连 接 、 选 择 和 闭 包 的 效应 的 NFA 
的 转换 。 图 2-4 给 出 了 对 应 于 RE a 和 b 的 NFA， 以 及 从 对 应 于 a 和 65 的 NFA 构 造 对 应 于 RE ab、albp 和 a* 的 NFA 
的 转换 。 在 对 应 于 a 和 b 的 NFA 处 可 以 是 任意 的 NFAS 。 

首先 ，Thompson 构 造 法 开始 于 对 输入 RE 中 的 每 个 字 
符 构建 一 个 小 的 NFA 。 其 次 ， 它 按 优先 性 和 括号 所 指定 的 a 的 NFA b 的 NFA 
顺序 依次 对 这 些小 NFA 做 连接 、 选 择 和 闭 包 对 应 的 转换 。 

对 于 RE a(blc) 的 例子 ，Thompson 构 造 法 首先 构建 对 应 于 a、 一 GO 人 

b 和 c 的 NEFA。 因 为 括号 的 优先 权 最 高 ， 它 下 一 步 构 建 对 应 FOLO 

于 中 c 的 NFA。 闭 包 的 优先 权 高 于 连接 的 优先 权 ， 所 以 它 构 < 的 NEA 

建 对 应 于 (ble)' 的 NFA。 最 后 ， 它 运用 连接 运算 符 来 构建 对 
应 于 ablo)' 的 NFA。 图 2-5 给 出 了 这 一 系列 转换 。 

这 一 构造 法 取决 于 RE 的 几 个 性 质 。 它 依赖 于 RE 运算 符 
与 NFA 上 的 转换 之 间 的 直接 的 对 应 关系 。 它 把 这 一 对 应 关 
系 与 RE 的 封闭 性 结合 起 来 以 确保 转换 生成 正确 的 NFA。 最 
后 ， 它 使 用 e 转 换 来 连结 对 应 于 子 表达 式 的 NFA; 这 使 得 转 
换 得 以 按 简单 的 模式 进行 。 

这 一 构造 法 得 到 的 NFA 有 几 个 有 用 的 性 质 。 

1) 每 个 NFA 有 一 个 初始 状态 和 一 个 终结 状态 。 进 入 
初始 状态 的 惟一 转换 是 初始 转换 。 没 有 从 终结 状态 出 发 的 
转换 。 

2) se 转换 总 是 连结 在 这 一 过 程 早期 得 到 的 对 应 于 部 分 
RE 的 NEA 的 初始 状态 或 终结 状态 。 图 2-4 对 应 于 正则 表达 式 运 算 符 的 小 NFA 

3) 每 个 状态 最 多 有 两 个 进入 的 e 转 换 和 两 个 出 去 的 e 转 换 ， 而且 最 多 有 一 个 标签 为 字母 表 中 符号 的 
入 边 和 一 个 标签 为 字母 表 中 符号 的 出 边 。 | 
这 些 性 质 简化 这 一 构造 法 的 实现 。 例 如 ， 这 一 构造 法 只 需 处 理 一 个 终结 状态 ， 而 不 需要 反复 处 理子 表达 
式 对 应 的 NFA 的 所 有 终结 状态 。 





日 、 实际 上 ， 这 里 的 NFA 有 一 定 的 限制 。 参 见 下 文中 关于 由 此 构造 法 构造 出 的 NFA 的 性 质 。 一 一 译 者 注 





a、:b 和 c 的 NFA 





ablo)* 的 NFA 


图 2-5 运用 Thompson 构 造 法 构建 对 应 于 a(b|c)" 的 NFA 
注意 ，Thompson 构 造 法 所 构建 的 对 应 于 a(b|c)" 的 NFA 中 的 状态 数目 是 如 此 之 多 。 我 们 也 许 喜 欢 生成 


一 个 简单 的 NFA， 例 如 如 下 所 示 的 NFA。 
人 b,c 


我 们 可 以 直接 消除 由 Thompson 构 造 法 所 构建 的 NFA 中 的 许多 se 转换 。 这 将 大 大 缩小 NFA 的 尺寸 。 然 而 ， 149 


l 


我 们 是 在 这 一 构造 法 的 后 期 阶段 将 它们 消除 ， 所 以 我 们 将 消去 e 转 换 的 一 般 算 法 作为 练习 留 给 读者 。 50 
2.4.3 NFAZIDFA: 子 集 构造 法 


Thompson 构 造 法 生成 识别 由 RE 描述 的 语言 的 NFA。 因 为 NFA 的 两 个 运行 模型 都 不 适 于 显然 、 高 效 
的 实现 ， 所 以 ， 下 一 步 的 工作 是 把 NFA 转 换 成 具有 简单 而 高 效 实现 的 DFA。 从 NFA(N, Z, Ô nos nr) 
出 发 ， 这 一 转换 必须 生成 一 个 DFA(D,，56。b，d。，D#:)。 这 一 转换 过 程 的 关键 步骤 是 从 NFA 得 到 D 和 6b。 
(NFA 和 DFA 的 字母 表 相 同 ， 而 do 和 Ds 会 在 D 和 65, 的 构造 过 程 中 显现 出 来 。) 构造 这 一 DFA 的 算法 称 为 子 
集 构造 法 。 图 2-6 给 出 这 一 算法 的 高 级 描述 。 

这 一 子 集 构造 法 构建 一 个 集合 8G， 它 的 元 素 q, 是 由 NN 的 子 集 所 构成 的 状态 集合 ， 也 就 是 说 ，g,E2”。 
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当 这 个 集合 被 构造 出 后 ， 每 一 个 元 素 q:EQ 将 对 应 于 DFA 中 的 一 个 状态 。 这 一 构造 法 通过 NFA 对 给 定 的 输 
入 能 做 出 的 所 有 转换 的 集合 构造 各 个 9;。 因 此 ， 集 合 gq 恰好 是 对 应 
于 特定 的 输入 集合 ，NEFA 所 能 达到 的 状态 的 集合 。 每 一 个 4 代表 go + e-closure( no) 


NFA 的 一 个 有 效 格局 。 Workin 40} 
为 了 构造 C， 这 一 算法 构造 一 个 初始 集合 go， 它 是 由 mo 以 及 while (WorkList + 0) 
NFA 通 过 只 包含 e 转 换 的 路 径 从 no 所 能 达到 的 状态 组 成 的 。 这 些 状 remove q from WorkList 
for each character ce X 
态 都 是 等 价 的 ， 因 为 它们 都 能 通过 空 输入 达到 。 t + e-closure(Delta(q,c)) 


这 一 代码 使 用 函数 e-c1osure: 2”->2* 来 从 no 构造 9。。 它 始 于 Tad et 
集合 "= {mo} ， 然 后 系统 地 在 mn 中 加 入 那些 可 以 从 m 中 的 某 个 状态 通 RR en and to Worklist 
过 Ee 转换 达到 的 状态 。 如 果 m 是 从 no 出 发 通过 标签 为 abc 的 路 径 能 够 
达到 的 状态 的 集合 ， 那 么 e-cJosure (m) 则 包含 从 no 出 发 通过 标签 图 2-6 子 集 构造 法 
为 abcs 的 路 径 能 够 达到 的 所 有 状态 。 

这 一 算法 使 用 第 二 个 函数 De7ta: 2" x 研一 2* 来 计算 NFA 的 状态 集合 的 转换 。pDeta(g;，c) 把 NFA 的 
状态 转换 函数 作用 于 g, 的 每 个 元 素 。 它 返回 NFA 的 状态 的 集合 ， 计 算 对 应 于 每 个 nEg, 的 56,(n，c) 的 并 。 

为 了 构造 Q 的 其 余部 分 ， 这 一 构造 法 选 出 一 个 集合 4; 并 使 用 Delta 去 寻找 从 gq, 开始 沿 着 标签 为 c 的 转换 
能 够 达到 的 状态 的 集合 。 它 计算 这 一 集合 的 e-closure ， 并 为 这 个 闭 包 指定 一 个 临时 名 字 t。 它 把 从 4g, 到 1 的 
转换 记录 在 一 个 表 T 中 。 如 果 1 不 属于 Q， 那 么 它 就 把 :加 入 到 Q@ 中 。 对 每 一 个 4/EQ 和 每 个 符号 cE> 重 复 这 
一 过 程 。 

whi1e 侍 环 反复 从 工作 列表 中 消去 集合 4 并 处 理 4。 4; 代 表 NFA 的 一 个 格局 。 这 一 算法 通过 对 的 元 
素 进行 选 代 并 运用 De1ta 和 e-c10sure 来 寻找 从 gq 出 发 能 够 达到 的 格局 。 它 把 找到 的 新 状态 加 入 到 Q 和 工 
作 列 表 中 。 因 为 NFA 至 多 有 |2^| 个 格局 ， 因 此 ， 这 一 过 程 一 定 会 终止 。 

遗憾 的 是 ，8 可 以 变 得 很 大 ， 最 多 可 以 有 |2 个 不 同 的 状态 。 输 入 的 NFA 中 的 非 确 定性 的 程度 决定 状 
态 扩张 的 程度 。 然 而 ,结果 的 DFA 仍 然 对 每 个 输入 字符 做 一 个 转换 ， 与 D 的 大 小 无 关 。 因 此 使 用 非 确定 
性 来 描述 和 构建 NFA 增 加 表示 相应 的 DFA 所 需要 的 空间 ， 但 是 不 增加 识别 输入 字符 串 所 需要 的 时 间 。 

1. 从 Q 到 D 

当 这 一 算法 结束 时 ， 它 已 构造 了 有 效 NFA 格 局 的 集合 2 和 记录 的 元 素 之 间 的 可 能 转换 的 表格 7T。 同 
时 ，Q 和 T 形 成 模拟 原来 NFA 的 DFA 的 模型 。 从 Q 和 TT 构建 DFA 是 直观 的 。 每 个 集合 gEQ 生 成 一 个 代表 状 
态 dED。 如 果 4, 包 含 NFA 的 终结 状态 ， 那 么 4 是 DFA 的 终结 状态 。 转 换 函 数 6p 可 以 直接 从 7 通过 从 qd 到 d 
的 映射 构造 出 来 。 最 后 ， 从 go 构造 出 的 状态 成 为 DFA 的 初始 状态 do。 

2. 例子 

考虑 2.4.2 节 中 给 出 对 应 于 a(b|c)" 的 NFA。 这 一 NFA 如 图 2-7 的 上 部 分 所 示 。 其 中 的 状态 已 经 重新 编号 。 
这 一 图 中 部 的 表格 粗略 给 出 了 子 集 构造 法 的 各 步 台 。 在 图 2-7 中 ， 表 格 的 第 一 列 给 出 在 一 个 给 定 的 馆 代 
na A 第 二 列 给 出 新 DFA 中 相应 的 状态 名 。 第 三 列 给 出 Q 的 当前 集合 中 的 NFA 
状态 的 名 字 的 集合 。 后 三 列 给 出 在 相应 状态 下 对 于 二 中 的 每 个 字符 的 De7ta 值 的 e-closure。 

iene 

1) 初始 化 集合 go 为 e-c10sure({no})。 第 一 次 迭代 计算 e-closure(Del1ta(qo, a), e-closure(Delta(q,, 
b)) 和 e-closure(Delta(qo, c)). 

各 列 给 出 对 那些 De7ta 计 算 所 返回 的 集合 运用 e-c10sure 的 结果 。 

2) 其 次 ， 算 法 在 第 一 次 迭代 对 9! 施 行 同样 的 处 理 。 这 生成 两 个 集合 ，9 和 93。 
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a) a(blc)"HINFA (所 有 状态 重新 编号 ) 


DFA e-closure(Delta(q, *)) 
RAB ap NFA 状 态 名 
状态 名 a b c 
Ni, N2, N3, 
qo do no { ees | - none- -none - 
na, Ng, Ng 
ny, Az, N3, ns, Ng, Ng, n7, Ng, Ng, 
a dy v A2, N3 -none - 5, Mg, Ng 71 Ng, Ng 
Na, Ng, Ng R3: N4, Ng ns, N4, Ng 
q d Ns, Ng, No, on 
2 -none — 
2 N3, Ng, Ng a 4s 
. N7, Ng, No, 
q dz -none -一 
3 (r Ng, Ng | ah 4s 
b) 子 集 构造 法 的 迭代 





c) 结果 DFA 


图 2-7 运用 子 集 构造 法 从 图 2-5 构 建 DFA 


3) 在 第 三 次 和 第 四 次 选 代 中 ， 算 法 尝试 从 9 和 49: 出 发 构造 新 状态 。 这 生成 与 9 和 49 相同 的 集合 ， 如 
上 表 所 示 。 

图 2-7 的 最 底部 分 给 出 结果 DFA; 它 的 状态 由 表 中 “DFA 状 态 名 ” 列 给 出 ， 它 的 状态 转换 由 生成 这 些 
状态 的 De1ta 运 算 给 出 。 因 为 集合 4,，4: 和 4; 全 都 包含 m (NEFA 的 终结 状态 ) ， 所 以 这 三 个 集合 都 对 应 于 
DFA 的 终结 状态 。 

3. 不 动 点 计算 

子 集 构造 法 是 不 动 点 计算 (fixed-point computation) 的 一 个 实例 ， 不 动 点 计算 是 计算 机 科学 中 经 党 
出 现 的 一 种 特定 计算 类 型 。 这 些 计算 的 特征 是 ， 将 单调 函数 选 代 应 用 于 这 一 其 结构 已 知 的 单调 函数 定义 
域 中 的 一 组 集合 。( 一 个 函数 /: D- 了 是 单调 函数 仅 当 对 于 任意 的 xED，Xx) >x， 其 中 DD 是 定义 域 .) 当 这 
些 计算 到 达 一 个 状态 ， 它 们 在 这 个 状态 处 的 进一步 的 迭代 产生 相同 的 答案 ， 也 就 是 由 这 个 算法 产生 的 连 
续 的 选 代 空间 中 的 “不 动 点 ”时 ， 这 些 计算 终止 。 不 动 点 计算 在 编译 器 构造 法 中 扮演 着 重要 的 角色 ， 我 
们 将 反复 运用 这 样 的 计算 。 

不 动 点 算法 终止 时 的 参数 通常 依赖 于 定义 域 的 已 知性 质 。 对 于 子 集 构造 法 ， 因 为 ={qo。，91，92，…， 
qu}， 其 中 每 一 个 qiE2"， 定 义 域 D 是 2”。 因 为 N 是 有 穷 的 ， 所 以 2 和 2” 也 是 有 穷 的 。wh11e 循 环 把 元 素 添 
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MBO; 它 不 能 从 QC 中 消除 元 素 。( whp77e 循 环 是 单调 递增 函数 ; 比较 运算 符 是 AD, EARED.) 因为 
Q 至 多 有 |2 生 个 不 同 元 素 ， 所 以 while 循 环 至 多 可 以 迭代 |2 和 1 次。 当然 ， 它 也 可 能 更 快 地 到 达 不 动 点 并 结束 。 
4. 脱 机 计算 e-closure 
子 集 构造 法 的 一 个 直观 的 实现 可 以 通过 跟踪 NFA 转 换 图 中 的 路 径 计 算 e-c1osure()。 然 而 ， 我 们 也 可 
考虑 另外 一 种 方法 : 对 于 NFA 的 转换 图 中 的 每 个 状态 x 计算 e-c1osure({n})， 它 的 脱 机 算法 如 下 所 示 : 
for each state n € N 
E(n) = {n} 
WorkList + N 
while (WorkList + @) 
remove n from WorkList 
te{n}u Unssm € én E(m) 
ift # E(n) then 
E(n) et 
WorkList — WorkList U { k| k&n € ôn } 
这 也 是 一 个 不 动 点 计算 。 | 
这 个 算法 终止 时 的 参数 比 图 2-6 的 算法 终止 时 的 参数 更 复杂 。 当 工作 列表 为 空 时 这 一 算法 终止 。 这 
个 工作 列表 的 初始 值 是 V。 每 当 集 合 发 生变 化 时 ， 算 法 把 它 在 转换 图 中 的 前 趋 加 到 工作 列表 中 。 
Eln) 集合 是 单调 增加 的 。 因 此 ， 每 个 ECa) 集合 至 多 可 以 变化 IN| 次 。 每 当 它 发 生变 化 ， 它 的 前 趋 就 
被 加 入 到 工作 列表 中 。 每 个 集合 有 固定 数目 的 后 继 ， 这 些 后 继 可 以 将 其 添加 到 工作 列表 |N| 次 。 因 此 ， 最 
终 工 作 列表 变 空 且 计 算 终止 。 
为 了 得 到 一 个 时 间 上 界 ， 我 们 观察 到 每 一 个 e 转 换 ? nm 可 以 把 na 加 入 工作 列表 至 多 |E(m)| 次 。 因 为 
|E(m)| < IN|， 且 转换 的 数目 不 超过 转换 图 中 边 的 数目 |6,|， 所 以 工作 列表 中 结 点 的 数目 在 整个 算法 中 不 超 
”过 |6,| - |M。 因 为 工作 列表 中 的 每 一 个 结 点 需要 wh11e 循 环 的 一 次 从 代 ， 上 式 也 给 出 了 秋 代 数目 的 上 界 。 


2.4.4 DFA 到 最 小 DFA: Hopcroft 算 法 


作为 对 RE-*DEFA 变 换 的 最 后 改进 ， 我 们 可 以 加 入 最 小 化 由 子 集 构 造 法 所 构建 的 DFA 的 步 又。 由 子 集 

构造 法 构建 的 DFA 可 能 有 庞大 的 状态 集合 。 尽 管 这 不 增加 扫描 字符 串 所 需 的 时 间 ， 但 是 它 的 确 增 加 内 存 

中 识别 器 的 大 小 。 对 于 现代 计算 机 ， 内 存 的 存 取 速度 通常 决定 着 计算 的 速度 。 较 小 的 识别 器 占有 较 少 的 
磁盘 空间 、 随 机 存 取 存 储 器 (RAM) 空间 和 处 理 器 的 高 速 缓冲 存储 器 空间 。 所 有 这 些 都 可 能 是 优势 。 

为 了 最 小 化 DFA(D，>，6，d。，Dz:)， 我 们 需要 一 个 识别 两 个 状态 是 否 等 价 的 技术 ， 在 这 里 两 个 状 

态 等 价 是 指 对 于 任意 输入 字符 串 这 两 个 状态 的 行为 相同 。 图 2-8 的 算 


法 把 DFA 中 的 这 些 状态 基于 它们 的 行为 划分 成 等 价 类 的 集合 。 P A cals 7 Dr H 
li angin 

这 一 算法 构造 出 集合 pl，p;，ps，…，p 的 集合 Pp， 其 中 每 一 个 p， Te mg 
是 含有 一 个 或 多 个 DFA 状 态 的 集合 。 之 所 以 说 p 划 分 D， 是 因为 : for each set p € P 

1) 每 个 pEP 包 含 一 个 或 多 个 DFA 的 状态 。 Te TU Split(p) 

2) 每 个 ED 刚好 是 一 个 pEP 的 成 员 。 。 

i 

LAR, PMR BLED: Ucwp;=D。 这 些 性 质 定义 了 D 的 一 | PEO heen 
个 划分 。 if c splits S into sı and sz 


then return { Sı, S2 } 
return S 


为 了 最 小 化 DFA ， 这 一 算法 构造 出 原来 DFA 的 状态 的 一 个 特定 
划分 。 它 根据 状态 的 行为 把 它们 组 合 起 来 形成 一 个 划分 。 对 于 任意 
的 PEP，p 中 任意 两 个 状态 4 和 di 对 于 任意 的 输入 字符 串 必 须 有 相同 图 2-8 DFA 的 最 小 化 算法 
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的 行为 。 为 了 最 小 化 DFA， 每 个 集合 pPEP 应 该 在 行为 等 价 的 条 件 下 尽 可 能 大 。 

为 了 构造 成 代表 最 小 DFA 的 划分 ， 这 一 算法 开始 于 一 个 初始 的 粗略 划分 ， 这 一 划分 满足 除 行为 等 价 性 
之 外 的 所 有 性 质 ， 并 且 通 过 和 迭代 细 化 这 一 划分 来 逐渐 使 其 满足 行为 等 价 性 。 初 始 划分 包含 两 个 集合 po= Dr 
和 pi= {D - Dr}。 把 终结 状态 隔离 到 po 确保 在 最 终 划分 中 没有 既 包 含 终结 状态 又 包含 非 终结 状态 的 集合 ， 
因为 这 一 算法 从 不 把 两 个 划分 的 集合 组 合 在 一 起 。 

算法 通过 反复 检查 每 一 个 pjEP 来 寻找 不 应 在 同一 个 集合 Pp 内 的 状态 来 细 化 初始 划分 。 显 然 ， 这 一 算 
法 不 能 跟踪 DFA 在 每 一 个 字符 串 上 的 行为 。 然 而 ， 它 能 够 模拟 给 定 状 态 对 于 单一 输入 字符 的 行为 。 这 导 
致 细 化 划分 的 一 个 简单 条 件 : 符号 cEY 对 每 个 状态 4Ep/ 必 须 产生 相同 的 行为 。 

这 一 分 离 动 作 是 理解 这 一 算法 的 关键 。 为 使 4 和 di 保留 在 同一 个 集合 rp 中， 它们 必须 对 每 个 字符 
cE5 做 等 价 的 转换 。 也 就 是 说 ， 对 任意 ce5 Hdd Add, Ahd Ad ER—tR AD EPH. MA 
使 dd,，d, 不 属于 p, 的 状态 diEp, 都 不 能 与 d 和 dj 在 相同 的 划分 集合 内 。 同 样 地 ， 如 果 d 没 有 对 于 c 的 转换 ， 
那么 它 也 不 能 与 4 和 dj 在 相同 的 划分 集合 内 。 

图 2-9 给 出 了 这 一 动作 的 图 示 。 这 里 ，p1= {d;，d)，d} 中 的 状态 是 等 价 的 当 且 仅 当 对 于 所 有 cE ， 这 
些 状 态 的 转换 把 它们 带 到 同一 等 价 类 中 的 状态 。 如 图 所 示 ， 对 于 c， 每 个 状态 有 一 个 转换 :4d; 久 d,、 
dd, 和 di-sd,。 如 果 如 左 图 所 示 ，d,、d, 和 d, 在 当前 划分 中 的 同一 个 集合 内 ， 那 么 di;、dj 和 di 也 应 保留 在 
同一 个 集合 内 ， 因 此 c 不 分 离 p,。 另 一 方面 ， 如 果 如 右 图 所 示 ，d,、d, 和 d. 不 全 在 同一 个 集合 内 ， 那 么 分 
离 p1。 此 时 ， 这 一 算法 必须 构造 两 个 新 集合 {dj} 和 {d)，d} 来 反应 对 于 以 c 开 始 的 字符 捉 会 产生 不 同 的 结 
果 这 一 可 能 性 。 如 果 状 态 d 没 有 对 于 c 的 转换 ， 那 么 应 该 产生 相同 的 分 离 结果 。 

为 了 细 化 划分 P， 这 一 算法 对 每 个 peP 和 每 个 
cE 做 检查 。 如 果 c 分 离 p， 这 一 算法 从 p 构 造 出 两 个 新 
集合 并 把 它们 加 到 7 中 。( 算 法 也 可 以 把 p 分 离 成 两 个 以 
上 的 集合 ， 每 个 集合 对 于 c 的 行为 都 一 致 。 然 而 ， 分 离 
出 一 个 行为 一 致 的 状态 集合 ， 而 用 p 所 有 其 余 的 状态 组 
成 另 一 个 集合 就 可 以 了 。 如 果 后 一 个 集合 中 的 状态 对 
于 c 的 行为 不 一 致 ， 那 么 这 一 算法 将 在 以 后 的 迭代 分 离 
T.) 算法 重复 这 一 过 程 ， 直 到 发 现 不 能 继续 分 离 划分 
中 的 集合 。 

为 了 从 最 终 的 划分 p 构 造 新 的 DFA， 我 们 可 以 对 每 个 集合 PEP 生 成 一 个 代表 它 的 状态 并 把 适当 的 转 
换 加 入 到 这 些 新 代表 状态 之 间 。 对 于 代表 p, 的 状态 和 字符 c<， 如 果菜 个 djep, 有 到 某 个 diep, 的 转换 ， 那 么 
对 于 c， 我 们 加 入 一 个 从 代表 p 的 状态 到 代表 pu 的 状态 的 转换 。 根 据 这 一 构造 法 ， 如 果 d 有 这 样 的 转换 ， 
那么 p 中 的 所 有 其 他 状态 都 有 这 样 的 转换 ; 如 果 情 况 不 是 这 样 ， 那 么 在 这 一 算法 中 ，c 将 分 离 p。 结 果 
DFA 是 最 小 的 ; 它 的 证 明 超 出 了 我 们 的 讨论 范围 。 

再 次 考 虚 由 Thompson 结 构 法 和 子 集 构造 法 所 生成 的 对 应 于 a(ble) 的 DFA: 








这 一 算法 构造 初始 划分 pi = {do} Alp. = {d1，d,，ds}。 因 为 p: 只 有 一 个 状态 ， 它 不 能 再 被 分 离 。 当 这 一 算 
法 检查 p; 时 ， 它 发 现 对 于 a 没 在 从 p; 的 任意 状态 出 发 的 转换 。 对 于 b， 每 个 状态 有 一 个 到 p; 的 转换 。 同样 地 ， 





34 #2 Ë 


Cc 总 是 引发 一 个 到 p, 的 转换 。 因 此 > 中 没有 符号 分 离 p: 而 且 划 分 P= dod, da, dJi MEZDFA. 
选择 p, 和 p; 的 代表 状态 并 加 入 转换 生成 如 下 的 DFA: 


这 正 是 我 们 手工 构造 的 DFA。 经 过 最 小 化 ， 自 动 技术 产生 了 同样 的 结果 。 

这 一 算法 是 不 动 点 计算 的 另外 一 个 例子 。P 是 有 穷 的 ， 它 至 多 包含 |D| 个 元 素 。while 循 环 分 离 P 中 的 
集合 ， 但 不 把 它们 组 合 起 来 。 因 此 | 中 单调 增 大 。 当 某 次 选 代 不 分 离 P 中 的 集合 时 ， 这 一 循环 终止 。 当 
DFA 中 的 每 个 状态 都 有 不 同 的 行为 时 ， 是 最 坏 的 情况 ， 在 这 最 坏 的 情况 中 ， 当 对 每 个 dED，P 都 有 不 同 
的 集合 时 ，while 循 环 终止 。 把 这 一 算法 运用 于 最 小 的 DFA 时 发 生 这 种 情况 。 


2.4.5 DFA 到 正则 表达 式 


如 图 2-3 所 示 的 循环 结构 中 的 最 后 一 步 是 从 DFA 构 造 相 应 的 正则 表达 式 。Thompson 构 造 法 与 子 集 构 
造 法 相 结 合 表明 DFA 至 少 有 与 RE 同样 强大 的 构造 化 证 明 。 本 节 给 出 Kleen 构 造 法 ， 对 于 任 给 的 DFA， 这 
一 构造 法 构建 表示 该 DFA 接 受 的 字符 串 集 合 的 RE。 这 一 算法 证 明 RE 与 DFA 同 样 强大 。 

把 DFA 的 转换 图 考虑 成 一 个 带 有 标签 边 的 图 。 得 到 描述 这 个 DFA 所 接受 的 语言 的 RE 的 问题 对 应 于 
DFA 转 换 图 上 的 路 径 问 题 。L(DFA) 中 的 字符 串 集 合 是 由 所 有 从 四 到 d 的 路 径 的 边 标签 组 成 的 集合 ， 其 中 
4aEDr。 对 任意 带 有 循环 转换 图 的 DFA， 这 样 的 路 径 集合 是 无 穷 的 。 幸 运 的 是 ， 我 们 有 克 林 闭 包 运 算 符 
来 处 理 这 种 情况 并 能 够 合成 由 循环 所 生成 的 整个 子路 径 集合 。 

图 2-10 给 出 计算 这 一 路 径 表达 式 的 一 个 算法 。 这 一 算法 假设 这 个 DFA 的 状态 的 编号 由 0 到 |D| -1， 且 
do 为 初始 状态 。 它 生成 表示 沿 着 转换 图 中 每 对 结 点 间 的 所 有 路 径 的 标签 的 表达 式 。 在 最 后 一 步 ， 它 把 表 
示 从 do 到 某 个 属于 Ds 的 终结 状态 d 的 路 径 的 表达 式 组 合 起 来 。 这 样 ， 它 便 系统 地 构造 出 所 有 路 径 的 路 径 


ty ; ILEEK Hi Enk kee for i=0 to |D|-1 
这 一 算法 计算 对 应 于 对 所 有 相关 的 i、j 和 Kk 的 记 作 R 的 ro lpi 


一 系列 表达 式 。 而 Rj 是 描述 转换 图 中 所 有 从 状态 i 到 状态 j R}, = {ald(d,a) = dj} 
且 不 通过 标记 比 k 大 的 状态 的 所 有 路 径 的 表达 式 。 在 这 里 ， if = j) then 
通过 (through) 意味 着 既 进 入 又 离开 某 个 状态 ， 因 此 如 果 RY = Fi, | te} 
存在 直接 从 1 到 16 的 边 ， 那 么 Ri ,就 是 非 空 的 “ 。 for k=l oe 
最 初 ， 这 一 算法 设置 R? 为 包含 直接 从 ;到 /的 所 有 边 的 for j= 0 to |D| —1 


标签 ， 因 为 直接 路 径 不 通过 结 点 。 通 过 一 系列 迭代 ， 算 法 R$ = RECRE IRES? | RS! 
通过 在 R 和 "中 添加 从 ;到 /通过 k 的 路 径 来 构建 更 长 的 路 径 。 | =|, esp RET 
给 定 R; !， 从 k -1 构造 (时 要 加 入 的 路 径 正好 是 一 条 从 i 跑 
到 但 不 通过 超过 k 一! 的 状态 的 路 径 ， 后 面 跟着 若干 条 从 k 图 2.10 从 DEA 构造 正则 表达 式 
到 其 身 的 不 通过 超过 t- 1 的 状态 的 路 径 ， 再 跟着 一 条 从 /到 
j 的 不 通过 超过 k- 1 的 状态 的 路 径 。 也 就 是 说 ，k 上 的 每 次 迭代 在 R 和 :中 加 入 通过 /的 路 径 。 
当 k 循 环 结束 时 ， 各 个 R! 表 达 式 统计 转换 图 中 的 所 有 路 径 。 最 后 一 步 计算 开始 于 d, 结 束 于 某 个 最 终 状 
态 dEDr 的 路 径 的 集合 作为 所 求 路 径 表达 式 。 





O 如果 有 一 条 从 1 到 2 且 有 一 条 从 2 到 16 的 边 ， 那 么 该 表达 式 也 非 空 。 一 一 译 者 注 
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2.4.6 将 DFA 作 为 识别 器 


至 此 ， 我 们 已 开始 开发 了 从 一 个 RE 构造 DFA 实 现 的 机 制 。 然 而 ， 编 译 器 的 扫描 器 必须 识别 出 现在 源 
语言 文法 中 的 所 有 语法 范畴 。 因 此 ， 我 们 所 需要 的 是 能 够 处 理 对 应 于 语言 微 语法 的 所 有 RE 的 识别 器 。 给 
定 对 应 于 各 语法 范畴 的 RE r,，r，,，r;，…，re， 我 们 就 可 以 构造 对 应 于 整个 语言 范畴 的 RE (rilrlrs|…|r)。 

如 果 我 对 这 个 RE 进行 处 理 ， 建 立 对 应 于 子 表达 式 的 NFA ， 把 它们 用 转换 连结 起 来 ， 合 并 状态 ， 构 
建 模拟 这 个 NFA 的 DEFA ， 然 后 把 这 个 DFA 转 化 成 可 执行 代码 ， 我 们 就 可 以 得 到 一 个 识别 与 某 个 ~ 相 匹配 
的 下 一 个 字 的 扫描 器 。 也 就 是 说 ， 当 我 们 对 某 个 输入 调用 扫描 器 时 ， 它 将 一 个 一 个 地 读 和 字符， 如 果 它 
耗 尽 输入 时 处 于 终结 状态 ， 它 就 接受 这 个 字符 串 。 因 为 大 多 数 实际 程序 都 包含 多 个 字 ， 所 以 我 们 需要 或 
者 改造 语言 或 者 改造 识别 器 。 

在 语言 层面 ， 我 们 可 以 认为 每 个 字 都 结束 于 某 个 容易 识别 的 分 隔 符 ， 如 空格 或 制 表 符 。 这 并 不 吸引 
人 。 从 字面 上 理解 的 话 ， 这 将 需要 我 们 用 分 隔 符 包围 逗号 及 诸如 十 和 -这样 的 运算 符 ， 以 及 括号 。 

在 识别 器 层面 ， 我 们 可 以 改变 DFA 的 实现 和 接受 的 概念 。 为 了 找到 与 RE 相 匹 配 的 最 长 的 字 ，DFA 应 
该 一 直 运 行 下 去 ， 直 到 它 到 达 一 个 状态 s，s 对 于 下 一 个 字符 没有 出 去 的 转换 。 这 了 时， 实现 必须 决定 它 与 
哪 一 个 RE 匹配 。 此 时 有 两 种 情况 ;第 一 种 情况 很 简单 。 如 果 s 是 终结 状态 ， 那 么 这 个 DFA 已 在 语言 中 找 
到 一 个 字 ， 并 将 报告 这 个 字 和 它 的 语法 范畴 。 

如 果 s 不 是 终结 状态 ， 情 况 就 更 复杂 。 如 果 DFA 在 它 通 向 s 的 路 径 上 通过 了 一 个 或 多 个 终结 状态 ， 那 
么 识别 器 将 报告 它 最 后 遇 到 的 终结 状态 ， 这 个 终结 状态 对 应 于 DFA 所 匹配 的 最 长 的 关键 字 。 为 了 实现 这 
一 点 ， 实 现 可 以 跟踪 最 近 的 终结 状态 ， 以 及 与 它 对 应 的 输入 字符 串 中 的 位 置 。 那 么 ， 当 它 达到 一 个 没有 
合法 转换 的 状态 * 时 ， 它 可 以 报告 最 近 的 终结 状态 ， 这 一 状态 或 者 是 ?或 者 是 前 面 的 某 个 状态 。 如 果 识 别 
器 在 通 向 s 的 路 径 上 没有 遇 到 终结 状态 ， 那 么 输入 不 始 于 一 个 有 效 字 ， 并 且 这 时 识别 器 将 向 用 户 报告 一 
个 错误 。 

另外 一 个 需要 考虑 的 复杂 问题 是 ，DFA 中 的 终结 状态 可 能 代表 原来 NFA 中 的 几 个 终结 状态 。 例 如 ， 
如 果 词 法 描述 包括 关键 字 的 RE 和 标识 符 的 RE， 那 么 如 new 这 样 的 关键 字 可 能 与 两 个 RE 匹配 。 识 别 器 必 
须 决定 返回 哪个 语法 范畴 : 是 标识 符 还 是 关键 字 new 的 单一 类 别 。 

大 多 数 扫 描 器 生成 器 工具 允许 编译 器 设计 者 指定 模式 间 的 优先 级 。 当 识别 器 与 多 个 模式 匹配 时 ， 它 
返回 最 高 优先 级 模式 的 语法 范畴 。 这 一 机 制 用 简单 的 方法 解决 了 这 一 问题 。 随 着 许多 Unix 系 统 发 布 的 扫 
描 器 生成 器 1ex 基 于 正则 表达 式 在 列表 中 的 位 置 指定 优先 级 。 第 一 个 RE 的 优先 级 最 高 ; 最 后 的 RE 的 优先 
级 最 低 。 
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直截了当 的 扫描 器 生成 器 以 一 系列 RE 为 输入 ， 为 每 个 RE 构造 相应 的 NFA， 用 e 转 换 连 结 这 些 NFA 
( 按 Thompson 构 造 法 中 对 应 于 ajb 的 模式 .) 执行 子 集 构造 法 生成 相应 的 DFA， 然 后 再 最 小 化 这 一 DFA。 
此 后 ， 扫 描 器 生成 器 必须 给 出 DFA 的 可 执行 代码 。 

本 节 和 覆盖 从 DFA 到 扫描 器 实现 中 出 现 的 若干 问题 。 前 两 小 节 给 出 从 DFA 构 造 可 执行 代码 的 若干 策略 。 
其 余 几 小 节 描 述 在 扫描 器 设计 和 实现 中 出 现 的 若干 低层 次 问题 。 


2.5.1 表 驱 动 扫描 器 

为 了 把 DFA 转 化 成 可 执行 程序 ， 扫 描 器 生成 器 使 用 一 个 框架 扫描 器 ， 它 以 实现 转换 函数 6 的 表 为 参 
数 。 改 变 扫 描 器 识别 的 语言 需要 修改 这 个 表 。 回想 一 下 我 们 最 初 的 ILOC 寄 存 器 描述 (xr[0.….9][0...97) 所 
对 应 的 FA。 
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A 
(0) r (1) [0..9] 


图 2-11 给 出 了 这 个 DEFA 的 表 驱 动 实现 。 这 一 表 代表 转换 函数 5。 


char + NextChar() 

state + so 

while (char # eof) 
state + 6(state,char) 


char — NextChar() 


if (state € Sp) 
then report acceptance 
else report failure 





图 2-11 寄存 器 名 的 扫描 器 


作 玫 时， 我 们 把 数字 0 到 9 的 各 列 压缩 到 一 列 中 。 这 表明 使 用 简单 的 方法 ， 如 合并 相同 列 ， 就 可 以 进 
行 压缩 。 然 而 ， 使 用 压缩 表 需 要 对 应 于 输入 字符 的 进一步 转换 。 通 常 这 对 每 个 字符 需要 一 个 额外 的 存储 
[62] 器 引用 ; 存储 器 的 额外 引用 与 大 表格 的 代价 权衡 取决 于 目标 机 器 。 
这 一 表格 可 压缩 程度 取决 于 DFA 的 结构 。 例 如 ， 改 进 后 的 寄存 器 描述 


Gol12)(0…9]151(4156l78l9)1(3(0b1e)) 


生成 一 个 七 状态 DFA， 图 2-12 给 出 了 它 对 应 的 表格 。 这 张 表 比 图 2-11 包 含 更 多 的 信息 ; 因此 ， 它 不 能 压 
缩 那么 多 。 


Se 
Se 
Se 
Se 
Se 
Se 
Se 
Se 





图 2-12 实现 改进 后 的 寄存 器 描述 





Ei 4B 37 


从 DFA 的 描述 生成 相应 表格 是 直截了当 的 。 依 次 对 于 每 个 状态 ， 代 码 检查 每 个 出 去 的 转换 并 释放 表 . 


中 的 适当 行 。 
2.5.2 直接 编码 扫描 器 


表 驱 动 扫描 器 使 用 一 个 明确 的 变量 state 存 放 DFA 的 当前 状态 。while 循 环 测试 char 是 否 是 eof，, 计 
算 新 状态 ， 读 人 下 一 个 字符 ， 并 分 支 到 循环 的 顶部 。 实 现 花费 大 量 的 时 间 来 处 理 或 测试 这 一 状态 。 

表 存 取 也 导致 一 些 额 外 的 开销 ; 特别 地 ， 地 址 计算 需要 一 个 乘法 和 一 个 加 法 (参见 7.5 节 )。 我 们 可 
以 通过 将 状态 的 信息 间接 地 编码 到 程序 计数 器 中 来 避免 大 部 分 额外 开销 。 在 这 一 模型 中 ， 每 个 状态 依据 
它 的 转换 检查 下 一 个 字符 并 直接 分 支 到 下 一 个 状态 。 这 样 就 可 生成 一 个 带 有 复杂 控制 流 的 程序 。 图 2-13 
给 出 按 这 种 方法 写成 的 框架 识别 器 ;， 它 实现 图 2-11 的 FA。 这 一 代码 比 表 驱动 代码 更 长 、 更 复杂 。 因 为 对 
每 个 字符 它 导致 的 额外 开销 较 少 ， 因 此 它 也 应 该 比 表 驱动 代码 更 快 。 


goto so 


So: char + NextChar() 
if (char = 'r}) 


sz: char + NextChar() 
if (0’<char<'9)) 
then goto s2 


then goto sı else if (char = eof) 
else goto Se 


then report acceptance 
Sı: char — NextChar() else goto Se. 
if (0’<char<'99 
then goto s2 
else goto Se 


Se: report failure 





图 2-13 “r digit digit*” 的 直接 编码 识别 器 


当然 ， 这 一 实现 范例 违反 许多 结构 化 程序 设计 的 规则 。 像 这 样 的 小 例子 ， 代 码 也 许 容易 理解 。 当 
RE 描述 变 得 更 复杂 且 生 成 更 多 的 状态 和 更 多 的 转换 时 ， 增 加 的 复杂 性 可 能 导致 代码 令 人 难以 理解 。 如 
果 我 们 使 用 自动 工具 直接 从 一 系列 RE 生成 这 一 代码 ， 那 么 我 们 没有 多 少 理由 去 阅读 或 调试 这 一 扫描 器 
代码 。 因 此 ， 更 低 的 开销 和 更 好 的 内 存 局 部 化 所 带 来 额外 的 速度 使 得 直接 编码 成 为 吸引 人 的 选择 。 


2.5.3 处 理 关 键 字 


到 此 为 止 ， 对 于 输入 语言 的 关键 字 ， 我 们 始终 假设 应 该 通过 在 生成 DFA 和 识别 器 的 描述 中 明确 包含 
它们 的 RE 来 进行 识别 。 很 多 作者 提出 了 另外 一 个 策略 : 让 DFA 把 关键 字 分 类 成 标识 符 ， 并 测试 每 个 标识 
符 来 决定 它 是 否 是 关键 字 。 

这 一 策略 对 于 手工 扫描 器 是 有 意义 的 。 由 于 明确 地 关键 字 检 测 所 增加 的 额外 复杂 性 导致 DFA 状 态 数 
目的 急剧 增加 。 这 会 增加 手工 编码 程序 的 实现 负担 。 用 一 个 适当 的 散 列表 (参见 B.4 节 )， 每 次 查找 的 期 
望 代价 应 该 是 一 个 常量 。 事 实 上 ， 这 一 方案 已 被 用 作 完 全 逆 列 (perfect hashing) 的 一 个 典型 应 用 。 在 
完全 散 列 中 ， 对 一 个 固定 的 键 集合 ， 实 现 器 确保 散 列 函数 生成 一 个 不 含 冲突 的 整数 的 紧 致 集 。 这 可 以 降 
低 每 个 关键 字 的 查找 代价 。 如 果 表 实现 考虑 完全 散 列 函数 ， 仅 一 次 探测 就 可 以 区 分 关键 字 和 标识 符 。 然 
而 ， 如 果 探 测 反 复 失败 ， 那 么 这 一 行为 对 非 关键 字 比 对 关键 字 要 更 加 不 利 。 

如 果 编 译 器 设计 者 使 用 扫描 器 生成 器 构建 识别 器 ， 那 么 就 是 由 这 一 工具 来 处 理 识 别 DFA 中 的 关键 字 
所 增加 的 复杂 性 。 这 些 额 外 增加 的 状态 消耗 内 存 但 不 消耗 编译 时 间 。 使 用 DFA 机 制 识别 关键 字 避 免 对 每 
个 标识 符 的 表 查 找 。 它 还 避免 实现 关键 字 表 和 支持 函数 的 开销 。 在 大 多 数 情况 下 ， 把 关键 字 识 别 掺 入 
DFA 比 使 用 分 离 查 找 表 更 有 意义 。 
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2.5.4 描述 动作 


在 构建 扫描 器 生成 器 中 ， 设 计 者 可 以 允许 对 DFA 的 每 个 转换 都 做 相应 的 动作 ， 也 可 以 只 容许 对 DFA 
的 终结 状态 做 相应 动作 。 它 的 选择 对 结果 DFA 的 效率 有 很 大 的 影响 。 例 如 ， 考 虑 我 们 早 些 时 候 给 出 的 表 
示 无 符号 整数 的 RE 0|[0..9][0...9]"。 只 容许 对 终结 状态 做 动作 的 扫描 器 生成 器 将 人 迫使 用 户 重 新 扫描 字符 
串 来 计算 它 的 实际 值 。 因 此 ， 扫 描 器 需要 重 写 读 取 已 识别 的 字 的 各 字符 ， 实 施 适当 的 动作 来 将 文本 转换 
成 十 进 制 的 值 。 更 精 糕 的 是 ， 如 果 系 统 为 这 样 的 转换 提供 内 置 的 机 制 ， 那 么 程序 员 将 很 可 能 使 用 它 ， 即 
便 在 调用 这 一 进行 简单 且 常 用 的 操作 是 需要 额外 的 开销 。( 在 Unix 系 统 中 ， 很 多 lex 生 成 的 扫描 器 包含 调 
用 sscanf() 来 精确 执行 这 一 功能 的 动作 。) 

然而 ， 如 果 扫 描 器 生成 器 允许 对 每 个 转换 做 动作 ， 那 么 编译 器 设计 者 可 以 运用 古老 的 汇编 语言 技巧 
来 实现 这 一 转换 。 在 识别 出 第 一 个 数字 时 ， 黑 加 器 被 设置 为 这 个 数字 的 值 。 对 每 一 个 后 继 数字 ， 累 加 器 
将 其 自身 乘 10 并 把 新 数字 加 进来 。 这 一 算法 避免 两 次 读 取 字 符 ; 识别 器 更 快 地 产生 结果 ， 而 且 可 以 内 联 
地 使 用 已 知 的 转换 算法 ; 它 消除 第 一 个 解决 方案 中 隐 含 的 字符 串 处 理 的 开销 。( 对 于 第 一 个 解决 方案 ， 
对 于 每 一 个 转换 ， 扫 描 器 也 可 能 把 输入 缓冲 器 中 的 字符 拷贝 到 结果 字符 串 中 。) 

一 般 地 ， 扫 描 器 应 该 避免 对 字符 进行 多 次 处 理 。 编 译 器 设计 者 在 安排 动作 上 自由 度 越 大 ， 就 越 容易 
实现 避免 拷贝 字符 并 多 次 检查 它们 的 高 效 且 功能 强大 的 算法 。 在 典型 编译 器 中 ， 人 们 也 许 会 忽视 这 种 程 
度 的 低 效 性 。 然 而 ， 在 基于 DFA 的 应 用 中 ， 如 果 模 式 匹 配 是 决定 时 间 效 率 的 重要 因素 ， 那 么 加 倍数 据 处 
理 量 是 至 关 重要 的 。 
表示 字符 串 

扫描 器 把 输入 程序 中 的 字 归 类 成 若干 范畴 。 从 功能 的 角度 看 ， 输 入 流 中 的 每 个 字 变 成 一 个 序 对 
《word, type) ， 其 中 word 是 形成 这 个 字 的 真实 文本 ， 而 type 表 示 这 个 字 的 语法 范畴 。 

对 于 很 多 范畴 ， 同 时 拥有 word 和 type 是 多 余 的 。 字 + 、x 和 for 只 有 一 种 拼写 。 然 而 ， 对 于 标识 
符 、 数 和 字符 串 ， 编 译 器 将 反复 使 用 word。 遗 憾 的 是 ， 很 多 编译 器 是 用 缺少 对 序 对 中 的 word 部 分 的 
适当 表示 的 语言 写成 的 。 我 们 需要 一 种 紧凑 且 能 进行 快速 对 比 的 表示 。 





处 理 这 一 问题 的 常用 的 做 法 是 ， 让 扫描 器 生成 一 个 的 散 列表 (参见 B.4 节 ) 来 存放 输入 程序 中 
| 的 所 有 不 同 的 字符 串 。 于 是 ， 编 译 器 或 者 使 用 这 个 “字符 串 表 ”中 的 字符 串 索 引 ， 或 者 使 用 指向 这 
个 字符 串 表 中 的 它 的 储存 映像 的 指针 ， 作 为 这 个 字符 串 的 代理 。 诸 如 字符 常量 的 长 度 或 数字 常量 的 
值 和 类 型 等 字符 串 的 信息 可 以 通过 这 个 表 一 次 计算 出 来 并 快速 引用 。 因 为 大 多 数 计算 机 对 整数 和 指 
针 有 高 效 存储 表示 ， 从 而 从 根本 上 减少 了 编译 器 内 部 的 内 存 使 用 量 。 对 整数 和 指针 代理 使 用 硬件 比 





较 机 制 ， 这 也 简化 了 比较 代码 。 


2.6 高 级 话题 


本 章 在 很 大 程度 上 讨论 了 扫描 器 描述 和 自动 生成 理论 。 这 一 理论 的 发 展 对 程序 设计 语言 的 设计 产生 
了 重大 的 影响 。 因 此 大 多 数 现代 程序 设计 语言 具有 简单 的 词法 结构 ， 这 样 就 可 以 使 用 基于 DFA 的 识别 器 
从 而 容易 扫描 。 为 了 找 出 难以 扫描 的 特征 ， 我 们 必须 考虑 老式 的 语言 。 

FORTRAN 77 有 一 些 不 易 扫 描 的 特征 。 空 格 的 制 表 符 没有 太 大 意义 ; 程序 员 可 以 加 入 它们 或 省 略 它 
们 而 不 改变 语句 的 含义 。(Algo68 有 相似 的 规则 。) 程序 员 可 以 用 anint、an int 或 an int 来 描述 同一 个 
变量 。 标 识 符 最 多 含 六 个 字符 ， 而 且 语 言 依赖 于 这 一 性 质 来 使 某 些 结构 得 以 识别 。 关 键 字 不 是 保留 字 ; 
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程序 员 可 以 把 它们 用 作 标 识 符 。(PLA 有 类 似 的 规则 。 ) 因此 ， 扫 描 器 必须 使 用 上 下 文 基 系 对 某 些 字 分 类 。 
最 后 ，FORTRAN 支 持 若 干 种 书写 文字 常数 字符 串 的 方式 。 

如 图 2-14 所 示 的 FORTRAN 代 码 片段 展示 出 扫描 FORTRAN 中 的 一 些 困 难 。 标 有 标签 10 的 语句 包含 三 
个 字 ，integer、function 和 a。 为 了 发 现 这 一 事实 ， 扫 描 器 必须 运用 标识 符 的 六 字符 限制 。 语 名 20 声 明 
a 和 b 为 “参数 ”: 可 以 代替 文字 常量 的 命名 明显 常数 。 以 语 名 20 为 上 下 文 ， 语 句 30 中 的 characterx(a-b) 
被 展开 成 character*4。 


Fortran 代 码 E # 


10 integerfunctiona 字符 规则 

20 parameter(a=6,b=2) 改变 下 一 个 语句 
30 implicit character*(a-b) (c-d) *(a-b) 变 成 *4 
40 integer format(10),if(10),d09e1 

50 format (4h)=(3) format 语 句 

60 format (4 )=(3) 对 format 的 赋值 
70 dogel=12 对 do9el1 的 赋值 


80 do9el=1,2 do 循环 头 部 
9e1 扫 描 为 9 和 e1 
90 if(x)=1 对 if 的 赋值 
100 if(x}h=1 
110 if(x)120,130 
120 end 
c This is a comment 必须 查看 前 面 内 容 的 注释 
$file(1) - $ 在 继续 域 
130 end 
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语句 50 是 一 个 format 语 句 ， 因 为 序列 4H 是 表明 ) = (3 是 一 个 文字 字符 串 的 前 级 ， 称 为 Hollerith 常 本。 
它 包 含 四 个 字 : 关键 字 format 、( 、 字 符 串 常量 ) = (3 和 )。 语 句 60 是 一 个 给 整数 数组 format 的 第 四 个 
元 素 赋值 的 语句 。 这 与 format 在 语法 范畴 的 差异 取决 于 4 后 面 是 否 有 字符 h。9S 

上 下 文 还 使 语句 70 和 80 不 同 。 语 句 70 是 对 整形 变量 do9e1 的 赋值 语句 ， 而 语句 80 中 的 逗号 使 它 成 为 
do 循环 的 头 。 语 名 90、100 和 110 在 形式 上 是 相似 的 。 然 而 ， 在 语句 90 中 ，if 是 一 个 标识 符 ， 而 在 语句 
100 和 110 中 它 是 关键 字 。 

语句 120 似 乎 是 一 个 表明 过 程 结 束 的 end 语 句 。 然 而 它 后 面 跟着 一 个 注释 ; 第 一 列 中 的 c 表 明 一 个 注 
释 行 。 注 释 后 面 的 一 行 在 第 六 列 包含 一 个 字符 ($)， 这 使 它 成 为 前 一 条 语句 的 继续 。 这 使 fi1e 成 为 标签 
为 120 的 语句 的 一 部 分 。 因 为 空格 、 换 行 和 插入 的 注释 行 没有 意义 ，120 中 的 第 一 个 字 是 endfi1e ， 它 被 
一 个 内 部 注释 分 为 两 部 分 。( 在 一 个 语句 的 中 间 [ 或 在 一 个 关键 字 的 中 间 ] 能 够 出 现 的 注释 行 的 数目 没有 
限制 . ) 语句 130 使 得 整个 过 程 真 正 结束 。 

1. 两 遍 扫 描 器 

很 多 FORTRAN 编 译 器 使 用 两 遍 扫描 器 。 其 中 有 一 些 ， 例 如 像 Rice 的 PFC 系统 的 扫描 器 有 两 个 明确 
的 遍 。 而 另外 一 些 ， 例 如 原始 的 Unix f77 编 译 器 和 f2c 编 译 器 的 扫描 器 ， 把 某 些 扫描 工作 和 简化 工作 作 


© 昌 然 FORTRAN 的 1977 标 准 已 经 取 销 了 Hollerith 常 量 , 但 是 几乎 所 有 的 FORTRAN 77 编 译 器 都 支持 这 些 常 量 ， 
以 向 后 兼容 1966 FORTRAN 标 准 。 
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为 输入 缓冲 的 一 部 分 来 做 。 这 两 种 方式 都 多 次 扫描 某 些 文本 。 

PFC 扫描 器 的 第 一 遍 执 行 特殊 的 分 析 ， 把 每 一 个 语 名 分类， 并重 写 文本 以 简化 第 二 遍 。 正 确 把 文本 
分 解 成 字 的 关键 是 把 赋值 语句 和 注释 与 其 他 语句 区 分 开 来 。 赋 值 语 句 始 于 一 个 标识 符 。 所 有 其 他 
FORTRAN 语 句 始 于 一 个 关键 字 。 

为 了 发 现 赋值 语句 ，PFC 扫 描 器 使 用 若干 规则 。 一 个 操作 符 被 认为 是 “自由 的 (free)”， 如 果 它 不 
在 一 个 或 多 个 括号 的 内 部 。 赋 值 句 必须 包含 一 个 自由 的 =。 如 果 一 个 自由 的 斜 线 出 现 于 第 一 个 自由 的 = 之 
前 ， 那 么 它 就 不 是 赋值 语句 。 语 句 中 的 自由 的 逗号 表明 这 个 语句 不 是 一 个 赋值 语句 。 

最 后 的 规则 是 复杂 的 。 如 果 扫 描 器 在 找到 自由 的 = 之 前 遇 到 了 括号 ， 而 且 括号 表达 式 后 面 的 第 一 个 
字符 既 不 是 = 也 不 是 ( ， 那 么 这 个 语句 不 是 赋值 语句 。 如 果 括 号 表达 式 后 面 的 字符 是 =， 那 么 这 个 语句 是 
一 个 赋值 语句 (正如 例子 中 的 语句 90)。 如 果 字 符 是 (， 那 么 它 也 许 是 子 串 表达 式 ; 在 这 种 情况 下 ， 这 个 
= 必须 迅速 跟随 第 二 个 括号 表达 式 。 最 后 ， 如 果 这 个 括号 表达 式 后 面 的 字符 既 不 是 = 也 不 是 (， 那 么 这 个 
语句 不 是 赋值 语句 ， 如 例子 中 的 语句 100 和 110。 

PFC 扫描 器 的 第 一 遍 使 用 指明 语句 类 型 的 标签 标识 每 个 语句 。 它 删除 所 有 注释 。 它 发 现 字 符 串 常量 
并 使 用 统一 旦 可 识别 的 语法 重 写 这 些 字符 串 常量 。 它 展开 参数 (parameter) 的 每 个 使 用 。 伴 随 这 些 改 
变 ， 代 码 变 得 更 容易 扫描 。 

第 二 遍 逐 语句 检查 代码 。 它 检查 语句 的 类 型 并 对 语句 的 其 余部 分 调用 适当 的 识别 器 。Format 语 句 的 
语法 与 其 他 语句 有 很 大 不 同 。 

在 扫描 期 间 仍 然 需 要 有 些 上 下 文 关 系 。 例 如 ， 字 符 串 do9e1 是 语句 70 中 的 一 个 字 ， 而 在 语句 80 中 是 
三 个 字 。 在 处 理 语 名 80 中 的 do 之 后 ， 扫 描 器 遇 到 9e1 ， 并 识别 标签 90 和 标识 符 e1 ， 而 不 是 识别 一 个 浮 点 
数 9e1 。 

2. 使 用 右上 下 文 

某 些 扫描 器 生成 器 包含 描述 右上 下 文 的 表 记 法 。FORTRAN 的 一 些 困 难 可 以 通过 在 识别 器 中 使 用 右 
上 下 文 而 得 到 解决 。 考 虑 do 关键 字 的 右上 下 文 的 RE。 它 必须 识别 一 个 标签 ， 其 后 是 一 个 标识 符 ， 一 个 =、 
一 个 数 和 一 个 逗号 。 

[0...9]" ([A...2]|[0..9D"* = [0...9]* 


如 果 把 关键 字 do 加 到 上 面 表达 式 的 前 面 ， 它 将 与 语 名 80 匹配， 但 与 语句 70 不 匹配 。 通过 使 这 个 
RE 的 优先 级 高 于 标识 符 的 RE 的 优先 级 ， 并 且 使 识别 器 在 最 初 的 do 的 后 面 标示 出 匹配 字符 串 的 结尾 ， 编 
译 器 设计 者 就 可 以 使 用 基于 RE 的 识别 器 寻找 关键 字 do。 类 似 的 右上 下 文 使 识别 器 能 够 在 语句 80 中 把 9e1 
作为 一 个 标签 和 一 个 标识 符 识 别 ， 而 不 是 当 作 一 个 浮 点 数 来 识别 。 

使 用 右上 下 文 使 得 编译 器 设计 者 处 理 很 多 FORTRANR 的 复杂 问题 。 然 而 ， 有 一 些 问 题 使 用 这 一 机 
制 也 是 不 容易 解决 的 。 如 语句 120 中 的 内 部 注释 需要 一 个 能 够 包含 任意 字符 的 无 界 右 上 下 文 ， 只 要 这 个 
注释 出 现在 以 c 为 第 一 列 字符 的 那 一 行 。 为 了 处 理 内 部 注释 ， 我 们 可 以 在 RE 的 任意 两 个 符号 之 间 加 入 表 
示 注 释 的 正则 表达 式 。 这 样 就 使 得 RE 变 得 很 大 且 更 不 容易 设计 。 我 们 可 以 通过 缓冲 输入 的 代码 中 的 一 
个 巧妙 的 机 制 识 别 注释 和 字符 串 ; f77 和 f2c 的 扫描 器 就 使 用 了 这 一 机 制 。 

与 此 相对 应 ， 参 数 展开 引 起 的 复杂 问题 可 以 推迟 到 分 析 器 来 处 理 。 使 用 这 一 方法 ， 扫 描 器 把 参数 党 
量 的 使 用 作为 标识 符 来 识别 。 分 析 器 对 语言 使 用 较 宽 松 的 文法 。 例 如 ， 文 法 将 需要 允许 字符 串 长 度 的 表 
达 式 包含 含有 标识 符 的 表达 式 。( 这 一 标准 指出 这 样 的 表达 式 必 须 是 一 个 无 符号 整数 常量 、 一 个 值 为 正 


O “我们 已 通过 假设 循环 索引 变量 的 初始 值 是 一 个 正 整数 简化 了 这 一 表达 式 。 
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整数 的 整数 常量 表达 式 或 者 是 一 个 星 号 。 ) 分 析 器 将 为 这 一 表达 式 构 建 一 棵 小 的 表达 式 树 ， 计 算 它 ， 并 
把 它 替 换 成 一 个 整数 值 。 


2.7 概括 和 展望 


”搜索 和 扫描 中 的 正则 表达 式 的 广泛 运用 是 现代 计算 机 科学 的 一 个 成 功 的 故事 。 这 些 想法 是 作为 形式 
语言 和 自动 机 理论 的 早期 部 分 而 发 展 起 来 的 。 作 为 一 种 精确 描述 恰好 是 正则 语言 的 字符 串 集 合 的 一 种 手 
段 ， 它 们 被 广泛 运用 从 文本 编辑 ， 到 网 络 过滤 引 擎 ， 再 到 编译 器 的 工具 中 。 只 要 我 们 要 识别 字 的 有 限 集 
合 ， 那 么 基于 DFA 的 识别 器 就 值得 我 们 认真 考虑 。 

大 多 数 现代 编译 器 使 用 已 生成 的 扫描 器 。 确 定性 有 穷 自 动机 的 性 质 与 编译 器 的 需求 非常 匹配 。 识 别 
一 个 字 的 代价 与 它 的 长 度 成 正比 。 在 精心 的 实现 下 ， 每 个 字符 的 开销 很 小 。 可 以 通过 广泛 运用 的 最 小 化 
算法 减少 状态 数 。 状 态 的 直接 编码 比 表 驱动 解释 器 的 速度 更 快 。 因 为 广泛 可 用 的 扫描 器 生成 器 很 优秀 ， 
所 以 很 少 有 理由 去 手工 实现 。 


本 章 注释 


将 词法 分 析 ( 即 扫描 ) 与 语法 分 析 分 离开 来 最 初 是 出 于 效率 的 问题 。 因 为 扫描 的 代价 按 字符 数量 成 
线性 增长 ， 其 系数 不 大 ， 把 语法 分 析 器 的 语法 分 析 交 给 独立 的 扫描 器 来 完成 降低 了 编译 的 代价 。 高 效 分 
析 技 术 的 出 现 削弱 了 这 一 观点 ， 但 是 由 于 在 词法 结构 和 语法 结构 之 间 存 在 着 清晰 的 界线 ， 我 们 仍然 坚持 
构建 扫描 器 。 

因为 扫描 器 构造 法 在 建立 实际 的 编译 器 中 起 的 作用 很 小 ， 我 们 尽量 使 本 章 简洁 。 因 此 ， 本 章 省 略 了 
很 多 关于 正则 语言 和 有 穷 自动 机 的 定理 。 有 强烈 求知 欲 的 读者 也 许 对 这 些 感 兴趣 。 很 多 这 方面 的 优秀 教 
科 书 对 有 穷 自 动机 、 正 则 表达 式 以 及 它们 很 多 有 用 的 性 质 给 出 了 更 深 的 论述 [184，222，307]。 

Kleene ( 克 林 ) [213] 确 立 了 RE 与 FA 之 间 的 等 价 关 系 。 克 林 闭 包 和 RE 一 DEFA 算 法 都 以 他 的 名 字 命名 。 
McNaughton 和 Yamada 给 出 了 从 RE 到 NEFA 的 构造 法 [236]。 本 章 的 构造 法 是 以 Thompson 的 工作 [321] 为 蓝 


图 的 。Thompson 构 造 法 是 从 为 了 实现 一 个 早期 的 文本 编辑 器 中 的 文本 搜索 指令 得 来 的 。Johnson 首 先 把 ， 


这 一 技术 应 用 于 自动 构建 扫描 器 [197]。DFA 最 小 化 算法 归功 于 Hopcroft[183]。 这 一 算法 在 很 多 不 同 的 问 
题 中 得 到 了 应 用 ， 其 中 包括 检测 两 个 程序 变量 总 是 取 相 同 值 的 时 间 [21]。 

Preston Briggs 指 出 了 保留 字 的 完全 散 列 [248] 对 扫描 器 性 能 的 负面 影响 。 图 2-14 所 示 的 FORTRAN 代 
码 来 自 于 与 E. K. Zadeck 的 一 席 谈话 ， 当 时 他 还 是 一 个 研究 生 。 


第 3 章 
语法 分 析 





3.1 概述 


编译 器 的 语法 分 析 器 主要 负责 识别 语法 ， 也 就 是 说 ， 负 责 确定 被 编译 程序 是 否 是 这 一 程序 设计 语言 
中 的 语法 模型 的 合法 句子 。 语 法 分 析 器 工作 于 程序 的 抽象 译本 ， 即 由 扫描 器 产生 的 字 和 词性 的 流 。 如 果 
字 流 形成 一 个 合法 的 程序 , 那么 语法 分 析 器 就 建立 这 个 程序 的 一 个 具体 模型 以 供 编译 器 的 后 期 阶段 使 用 。 
编译 器 的 后 期 阶段 分 析 这 个 具体 模型 ， 进 行 语义 加 工 和 翻译 。 这 一 语法 分 析 的 结果 作为 程序 的 编译 器 内 
部 模型 而 记录 下 来 。 如 果 输 入 不 形成 合法 程序 ， 语 法 分 析 器 将 向 用 户 报告 存在 的 问题 ， 并 给 出 有 用 的 诊 
断 信 息 。 

语法 分 析 与 扫描 有 很 多 共同 之 处 。 特 别 是 ， 语 法 分 析 是 另外 一 个 这 样 的 领域 ， 在 这 一 领域 作为 基础 . 
的 数学 的 深入 研究 直接 导致 了 很 多 种 语言 高 效 识 别 器 或 语法 分 析 器 的 构建 。 有 许多 语法 分 析 器 结构 的 自 
动 构建 工具 。 本 章 学 习 如 何 使 用 上 下 文 无 关 文 法 表示 程序 设计 语言 的 语法 ， 以 及 学 习 如 何 根据 这 样 的 文 
法 构建 健壮 且 高 效 的 语法 分 析 器 。 本 章 的 后 半 部 分 集中 讨论 三 种 特殊 的 语法 分 析 技 术 。 讨 论 的 焦点 是 自 
顶 向 下 的 递归 下 降 分 析 和 自 底 向 上 的 LR(1) 分 析 。 对 于 典型 的 程序 设计 语言 ， 这 两 种 方法 可 带 来 高 质量 
的 语法 分 析 器 。 这 里 介绍 的 自 顶 向 下 的 递归 下 降 分 析 导 致 手工 编码 分 析 器 的 系统 构造 法 。 递 归 下 降 分 析 
器 通常 是 紧凑 且 高 效 的。 因为 同样 的 观点 直接 导致 表 驱 动 LL(1) 分 析 器 ， 所 以 本 章 简要 地 对 其 加 以 阐述 。 
这 里 介绍 的 自 底 向 上 的 LR(1) 分 析 导 致 高 效 、 精 确 、 表 驱动 分 析 器 的 自动 结构 法 。 所 有 这 三 种 技术 都 用 
于 商业 编译 器 。 

在 实践 中 ， 科 研 文献 中 以 及 其 他 教科 书 中 还 有 很 多 其 他 语法 分 析 方法 。 我 们 聚焦 于 递归 下 降 分 析 
来 解释 自 顶 向 下 分 析 ， 这 是 因为 代码 与 相应 的 文法 之 间 具 有 直观 关系 ， 还 因为 使 用 这 一 关系 可 以 容易 
地 构建 高 效 的 递归 下 降 分 析 器 。 为 了 解释 自 底 向 上 分 析 ， 我 们 选择 规范 的 LR(1) 分 析 器 ， 因 为 它 更 具 一 
般 性 。 其 他 LR(1) 分 析 技 术 ， 特 别 是 SLR(1) 和 LALR(1)， 可 以 作为 规范 的 LR(1) 结构 的 简化 或 扩展 来 
理解 。 

本 章 的 3.2 节 介绍 上 下 文 无 关 文法 ， 并 探讨 把 程序 设计 语言 转换 成 上 下 文 无 关 文 法 形式 时 出 现 的 若 
干 问题 。3.3 节 揭示 自 顶 向 下 分 析 背 后 的 思想 ， 并 描述 通过 在 文法 结构 的 框架 下 使 用 手写 代码 构建 递归 
下 降 分 析 器 的 方法 。3.4 节 介绍 称 之 为 移入 归 约 分 析 的 自 底 向 上 分 析 的 风格 ， 开 发 驾 御 这 些 语法 分 析 器 
的 精致 的 数学 ， 并 给 出 LR(1) 分 析 器 的 例子 。3.5 节 给 出 如 何 得 到 构成 LR(1) 分 析 器 核心 的 分 析 表 ; 在 实 
践 中 ， 分 析 器 生成 器 系统 实现 这 些 算法 ， 使 得 编译 器 设计 者 无 需 手 工 执行 这 些 算法 。3.6 节 提出 在 设计 
和 构建 顶级 语法 分 析 器 中 出 现 的 一 系列 实际 问题 。 


3.2 表示 语法 


本 质 上 , 语法 分 析 器 是 确定 输入 程序 是 否 是 源 语言 中 的 语法 上 合法 句子 的 工具 。 为 了 回答 这 一 问题 ， 
我 们 需要 描述 输入 语言 的 形式 机 制 和 确定 在 这 一 形式 描述 的 语言 中 的 成 员 的 系统 方法 。 本 节 描述 一 种 表 


Da) 示 语 法 的 机 制 : 书写 形式 文法 的 Backus-Naur 形 式 的 一 种 简单 形式 。 本 章 的 其 余部 分 讨论 确定 由 形式 文 
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法 描述 的 语言 中 的 成 员 的 技术 。 
3.2.1 上 下 文 无 关 文 法 


为 了 描述 程序 设计 语言 的 语法 ， 我 们 需要 能 够 刻画 这 样 的 语言 的 语法 结构 并 导致 高 效 识 别 器 的 表 记 
法 。 第 2 章 的 正则 表达 式 不 足以 刻画 诸如 Java 或 C 等 语言 的 语法 。 我 们 需要 更 强大 的 表 记 法 。 表 示 语 法 的 
一 种 传统 的 表 记 法 是 文法 (grammar)， 它 是 从 数学 上 定义 哪些 符号 串 是 合法 句子 的 一 组 规则 。 称 为 上 下 
文 无 关 文 法 (context-free grammar) 的 一 类 文法 为 我 们 提供 这 种 能 力 。 幸 运 的 是 ， 上 下 文 无 关 文 法 的 许 
多 大 子 类 具有 导致 高 效 识 别 器 的 性 质 。 

一 个 上 下 文 无 关 文 法 G 是 一 组 描述 如 何 形成 句子 的 规则 ; 能 够 从 G 得 到 的 句子 集合 称 为 G 定 义 的 语言 
(language defined by G)， 记 作 L(G)。 举 一 个 例子 来 帮助 我 们 理解 。 考 虑 下 面 称 为 SN 的 文法 : 

SheepNoise — baa SheepNoise 
| baa 


第 一 个 规则 ， 或 产生 式 (production )， 读 作 “SheepNoise 可 以 派生 字 baa 后 面 跟 着 另 一 个 SheepNoise”。 
这 里 ，SheepNoise 是 表示 可 以 从 这 个 文法 派生 出 来 的 字符 串 集 合 的 语法 变量 。 我 们 称 这 样 的 语法 变量 为 
4424 A (nonterminal symbol)。 我 们 称 由 这 一 文法 所 定义 的 语言 中 的 字 为 终结 符 (terminal symbol). 
第 二 个 规则 读 作 “SheepNoise 也 可 以 派生 出 字符 串 baa。” 

为 了 理解 SN 文法 与 L(SN) 之 间 的 关系 ， 我 们 需要 指定 如 何 运 用 这 一 文法 中 的 规则 来 派生 出 L(SN) 的 
句子 。 首 先 ， 我 们 必须 确定 SN 的 目标 符号 (goal symbol) 或 开始 符号 (start symbol)。 目 标 符号 表示 
LSN) 中 的 所 有 串 的 集合 。 因 此 ， 它 不 会 是 这 一 语言 中 的 某 个 字 。 相 反 ， 它 必须 是 以 在 这 一 语言 中 添加 
结构 和 抽象 为 目的 而 引入 的 语法 变量 中 的 一 个 。 因 为 SN 只 有 一 个 语法 变量 ， 所 以 SheepNoise 必 须 是 目标 
符号 。 

为 了 派生 句子 ,我 们 从 目标 符号 SheepNoise 出 发 。 在 我 们 的 原型 字符 串 中 选 出 一 个 语法 变量 a， 选 
择 一 个 文法 规则 c~6， 然 后 用 有 替换 所 选 出 的 gc。 重复 这 一 过 程 ， 直 到 字符 串 不 再 包含 语法 变量 ; 此 时 ， 
这 个 字符 串 完 全 由 字 构 成 ， 它 是 这 个 语言 中 的 一 个 句子 。 














Backus-Naur 形 式 





计算 机 科学 中 表示 上 下 文 无 关 文法 的 传统 表 记 法 称 为 Backus-Naur 形 式 即 BNFE。BNEF 使 用 尖 括 号 
将 非 终结 符 括 起 来 ， 如 《SheepNoise>， 来 表示 非 终 结 符 。 它 在 终结 符 下 画 下 划 线 。 符 号 : := 表示 
“派生 ”， 而 符号 | 表示 “也 派生 ”。 在 BNF 中 ，Sheep Noise ( 羊 发 出 的 声音 ) 的 文法 变 成 
<SheepNoise> ::= baa <SheepNoise> 
| baa 
这 与 我 们 的 文法 SN 完全 等 价 。 
BNF 起 源 于 20 世 纪 50 年 代 末 到 20 世 纪 60 年 代 初 。 尖 括号 、 下 划 线 、: := 和 | 是 考虑 到 书写 语言 
述 的 人 在 排版 上 的 限制 而 使 用 的 。( 作为 一 个 极端 的 例子 ， 参 看 David Gries 的 《Compiler 
Construction for Digital Computers》， 这 本 书 是 用 标准 行 打印 机 印刷 的 [166]。 ) 本 书 在 排版 上 使 用 
BNF 的 更 新 形式 。 我 们 使 用 斜体 书写 非 终结 符 ， 用 代码 体 书 写 终 结 符 ， 用 符号 一 表示 “派生 ”。 

































在 这 样 的 派生 过 程 的 每 一 点 ， 字 符 串 是 文法 中 的 一 组 符号 。 这些 符号 可 以 是 终结 符 ， 也 可 以 是 非 终 
结 符 。 当 这 样 的 字符 串 出 现 于 一 个 合法 派生 中 的 某 一 步 中 时 ， 也 就 是 说 ， 它 可 以 从 开始 符号 派生 出 来 并 
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且 从 它 可 以 派生 出 合法 句子 时 ， 我 们 称 其 为 名 型 (sentential form)。 如 果 我 们 开始 于 SheepNoise ， 并 使 
用 这 两 个 规则 持续 重 写 它 ， 那 么 这 一 过 程 中 的 各 字符 串 都 是 名 型 。 当 我 们 到 达 只 包含 字 (而 不 包含 语 
法 变量 ) 的 字符 串 时 ， 那 么 这 个 字符 串 就 是 LSN) 中 的 一 个 句子 。 
对 于 SV， 我 们 必须 开始 于 字符 串 ShneepNoise。 使 用 规则 2， 我 们 可 以 将 SheepNoise 重 写成 baa。 因 为 
这 一 句 型 只 包含 终结 符 ， 没 有 进一步 重 写 的 可 能 。 因 此 ， 名 型 baa 是 这 一 文法 定义 的 语言 中 的 合法 句子 。 
我 们 可 以 用 表格 形式 表示 这 一 派生 。 


规 则 IJ 型 


SheepNoise 
2 baa 


我 们 也 可 以 开始 于 SheepNoise 并 运用 规则 1 派生 出 句 型 baa SheepNoise。 接 着 ， 我 们 使 用 规则 2 派生 
出 句子 baa baa, 


规 w IJ 型 
SheepNoise 
1 baa SheepNoise 
2 baa baa 


为 方便 表 记 ， 我 们 扩展 符号 一 的 解释 ; 方便 时 ， 我 们 使 用 一 :表示 “用 一 步 或 多 步 派生 出 。” 因 此 ， 
我 们 可 以 写 SheepNoise-*baa baa, 

当然 ， 我 们 用 规则 1 取代 规则 2， 生 成 更 多 个 baa 组 成 的 字符 串 。 反 复 运 用 这 一 规则 模式 ， 即 使 用 规 
则 序列 (rule 1)"rule 2， 将 派生 出 由 字 baa 的 一 次 或 多 次 出 现 组 成 的 语言 。 这 对 应 于 在 通常 环境 下 羊 发 出 
的 声音 组 成 的 集合 。 所 有 这 些 派生 都 有 同样 的 形式 。 


规 Ml 名 型 
SheepNoise 
1 baa SheepNoise 
1 baa baa SheepNoise 
...and so on... 
1 baa...baa SheepNoise 
| 2 baa baa...baa 


更 加 形式 地 ， 上 下 文 无 关 文法 G 是 一 个 四 元 组 (T, NT, S, P), $p 

7 是 语言 中 终结 符 或 字 的 集合 。 在 编译 器 中 ,终结 符 对 应 于 词法 分 析 中 识别 的 字 。 终 结 符 是 文法 名 
子 的 基本 单位 。 

NT 是 出 现 于 文法 规则 中 的 非 终 结 符 的 集合 。NT 由 规则 中 涉及 的 所 有 不 在 T 中 的 符号 组 成 。 非 终结 符 
是 文法 设计 者 用 于 为 规则 提供 抽象 和 结构 的 语法 变量 。 

5 是 称 为 目标 符号 或 开始 符号 的 NT 的 特定 成 员 。G 描 述 的 语言 ， 记 为 L(G)， 刚 好 包含 那些 从 5 派生 出 
来 的 合法 句子 。 换 句 话说 ，5 表 示 L(G) 的 句子 的 集合 。 

P 是 产生 式 或 重 写 规则 的 集合 。 形 式 地 ，P: NT 一 (TU NT)*， 或 P 将 NT 中 的 元 素 映 射 到 《TU NT) 中 的 


O 在 每 一 步 ， 我 们 可 以 使 用 左 部 出 现 于 句 型 的 任意 规则 。 这 些 规则 没有 通过 上 下 文 规定 我 们 使 用 规则 的 优先 
级 。 由 于 这 一 原因 ， 我 们 称 这 样 的 文法 为 上 下 文 无 关 文法 。 当 我 们 更 加 形式 地 定义 上 下 无 关 文 法 时 ， 将 通 
过 文法 中 对 于 每 个 规则 的 形式 的 限制 来 具体 体现 这 一 概念 。 
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元 素 。 注 意 ， 这 一 定义 规定 产生 式 的 左 部 必须 是 单一 的 非 终结 符 。 这 一 限制 确保 文法 是 上 下 文 无 关 的 。 
P 中 的 规则 刻画 这 一 文法 的 语法 结构 。 
我 们 可 以 直接 从 文法 规则 得 到 T、NT 和 P。 对 于 SN， 这 些 集 合 的 取 值 如 下 所 示 : 


S = i 
T =e baa] SheepNoise 
SheepNoise 一 baa SheepNoise 
= i. E = 
io (heniek { SheepNoise 一 baa | 


在 SN 中 ，SheepNoise 必 须 是 开始 符号 5， 因 为 NT 只 包含 一 个 符号 。 一 般 地 ， 发 现 开始 符号 是 不 可 能 
的 。 例 如 ， 考 虑 文法 : 


Paren 一 ( Bracket ) Bracket - [ Paren | 
| ( ) | [ ] 


这 一 文法 描述 由 交替 出 现 的 圆 括 号 和 方 括号 组 成 的 平衡 对 构成 的 句子 的 集合 。 然 而 ， 我 们 不 清楚 最 
外 面 的 一 对 括号 应 该 是 圆 括号 还 是 方 括号 。 指 定 Parez 为 开始 符号 8 时 强制 最 外 面 的 是 圆 括 号 。 指 定 
Bracket 为 开始 符号 S 时 强制 最 外 面 的 是 方 括号 。 如 果 和 希望 最 外 面 的 括号 既 可 以 是 圆 括 号 也 可 以 是 方 括号 ， 
那么 我 们 需要 两 个 额外 的 产生 式 : 
Start — Paren 
| Bracket 


现在 ， 这 个 文法 有 一 个 明确 的 目标 符号 Start， 它 不 出 现 于 任意 产生 式 的 右 部 。 对 文法 进行 操作 的 某 
些 工 具 需 要 文法 拥有 不 出 现 于 任何 产生 式 的 右 部 的 开始 符号 Start。 它 们 使 用 这 一 性 质 简化 发 现 $ 的 过 程 。 
其 他 工具 则 简单 地 假设 5 是 第 一 个 产生 式 的 左 部 。 正 如 上 述 例子 所 提示 的 那样 ， 我们 总 可 以 通过 增加 一 
个 非 终 结 符 及 若干 简单 的 产生 式 来 生成 惟一 的 开始 符号 。 


3.2.2 构造 句子 
为 了 探索 上 下 无 关 文法 的 功能 和 复杂 性 ， 我 们 需要 一 个 比 SN 更 复杂 的 例子 。 考 虑 下 面 的 文法 : 





iat Expr Expr Op num 


一 > 
me | 
pr a4 
“a | 

| 

| 


这 一 文法 定义 num 和 四 个 操作 符 +、-、x 和 + 上 上 的 表达 式 集 合 。 使 用 这 一 文法 作为 重 写 系 统 ， 我 们 
可 以 派生 出 很 多 表达 式 。 例 如 ， 运 用 规则 2 生成 一 个 只 含有 num 的 平凡 表达 式 。 使 用 规则 序列 1、3、2 生 
成 表达 式 num + num, 


mM a'N 
Expr 
1 Expr Op num 
3 Expr + num 


2 num + num 
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重 写 的 序列 越 长 就 生成 越 复杂 的 表达 式 。 例 如 ， 序 列 1，5，1，4，2 派 生 句 子 num - num x num, 


wm ni 句 型 


Expr 

Expr Op num 
‘Expr x num 

Expr Op num x num 
Expr — num x num 


Neme oO y 


num — num x num 


我 们 可 以 用 图 形 的 形式 描述 这 一 派生 过 程 。 


Expr Op num 


Expr Op num x 


| 


num 一 


这 一 派生 树 或 分 析 树 ， 表 示 按 某 种 顺序 的 派生 的 每 一 步 。 

至 此 ， 我 们 的 派生 总 是 展开 字符 串 中 的 最 右边 的 非 终 结 符 。 也 可 以 做 其 他 选择 ; 一 个 显然 的 选择 是 
在 每 一 点 选择 最 左边 的 非 终结 符 展 开 。 使 用 最 左 的 选择 可 以 为 同一 句子 生成 不 同 的 派生 序列 。 对 于 num - 
num x num， 最 左派 生 是 : 





mM m 名 型 
Expr 
1 Expr Op num 
1 Expr Op num Op num 
2 num Op num Op num 
4 num -num Op num 
5 num — num x num 


这 一 “最 左 ” 派 生 使 用 与 “最 右 ” 派 生 相同 的 一 组 规则 ， 但 是 运用 的 顺序 不 同 。 对 应 的 分 析 树 如 下 所 示 : 


Expr Op num 
Expr Op num x 


| 
num 一 
这 与 最 右派 生 的 分 析 树 相同 ! 这 一 分 析 树 表示 运用 于 派生 的 所 有 规则 ， 但 是 不 描绘 运用 的 顺序 。 

我 们 希望 给 定 句子 的 最 右派 生 (或 最 左派 生 ) 惟一 。 如 果 某 个 句子 存在 多 个 最 右 (或 最 左 ) RE, 
那么 在 派生 的 某 点 、 我 们 可 以 对 最 右 (RRE) 的 非 终结 符 做 不 同 的 展开 而 得 到 同样 的 句子 。 这 将 生成 
多 种 派生 ， 也 可 能 是 多 棵 分 析 树 。 因 为 后 期 的 翻译 阶段 将 把 意义 与 分 析 树 的 详细 形状 联系 起 来 ， 拥 有 生 
成 惟一 最 右 (RRE) 派生 的 文法 对 翻译 来 说 是 至 关 重 要 的 。 

当 且 仅 当 在 L(G) 中 存在 拥有 多 个 最 右 〈 最 左 ) 派生 的 句子 时 文法 G 是 歧义 的 (ambiguous )。 因 为 文 
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法 结构 是 句子 背后 的 含义 的 重要 线索 , 歧义 性 通常 是 不 受 欢迎 的 。 如 果 编 译 器 不 能 确定 一 个 句子 的 含义 ， 
那么 它 就 不 能 把 它 翻译 成 有 确定 意义 的 代码 序列 。 

程序 设计 语言 的 文法 中 出 现 的 歧义 结构 的 经 典 例子 是 很 多 类 Algol 语 言 中 的 if-then-else 结 构 。if- 
then-else 的 直观 文法 可 能 是 : 


T Statement — if Expr then Statement else Statement 
2 | if Expr then Statement 

3 | Assignment 

A |... other statements... 


这 一 片段 表明 el1se 部 分 是 可 选 的 。 遗 憾 的 是 ， 使 用 这 一 文法 ， 代 码 片段 : 
if Expr; then if Expr2 then Assignment, else Assignment. 


有 两 个 不 同 的 最 右派 生 。 这 两 个 最 右派 生 之 间 的 区 别 很 简单 。 使 用 缩 进 显示 语句 各 部 分 之 间 的 关系 ， 我 
们 有 : 


if Expri if Expr; 
then if Expr2 then if Expre 
then Assignment, then Assignment, 
else Assignment? else Assignment. 


左边 的 版 本 中 ，Assignments 受 控 于 里 面 的 1f， 所 以 当 Expr 为 真 且 Expr, 为 假 时 ， 执 行 Assignment,。 右 边 
的 版 本 把 else 部 分 与 第 一 个 if 联 系 起 来 ， 因 此 当 Expr 为 假 时 执行 Assignment,， 与 Expr, 的 值 无 关 。 显 然 ， 
派生 之 间 的 不 同 将 导致 被 编译 代码 的 不 同行 为 。 

为 了 消除 这 一 战 义 性 ， 必 须 修改 上 面 的 文法 来 描绘 决定 哪个 if 控 制 e1se 的 规则 。 为 了 修改 if-then- 
el1se 文 法 ,我 们 把 它 重 写成 : 


1 Statement 一 if Expr then Statement 

2 | if Expr then WithElse else Statement 
3 | Assignment 

4 


WithElse — if Expr then WithElse else WithElse 
| Assignment 


5 


这 一 解决 方案 规定 在 if-then-e1se 结 构 中 的 then 部 分 可 以 出 现 的 语句 集合 。 这 和 原来 的 文法 接受 相同 
的 句子 集合 ， 但 是 确保 每 个 else 非 歧义 地 与 一 个 特定 的 if 匹配 。 它 在 文法 中 描绘 了 一 个 简单 的 规则 : 每 
个 else 绑 定 到 最 内 部 的 未 闭合 放 。 对 于 上 例 ， 它 只 有 一 个 最 右派 生 。 


规则 句 型 


Statement 

if Expr then Statement 

if Expr then if Expr then WithElse else Statement 

if Expr then if Expr then WithElse else Assignment 
if Expr then if Expr then Assignment else Assignment 


ow ne 


这 一 重 写 的 文法 消除 了 歧义 性 。 
if-then-e1se 的 歧义 性 源 于 原来 文法 中 的 一 个 缺点 。 这 个 解决 方案 通过 强制 程序 员 容 易 记 住 的 一 条 
规则 解决 了 这 一 战 义 性 。( 为 了 完全 避免 歧义 性 ， 某 些 语言 设计 者 通过 引入 e1seif 和 endif 重 新 构建 if- 
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then-else 结 构 。) 在 3.6.3 节 ， 我 们 将 看 到 其 他 类 型 的 歧义 性 以 及 处 理 这 些 歧 义 性 的 系统 方法 。 


3.2.3 使 用 结构 描述 优先 权 


if-then-e1se 文 法 的 歧义 性 指出 了 文法 结构 与 语句 意义 间 的 关系 。 然 而 ， 歧 义 性 并 非 文 法 结构 与 语 
句 意义 相互 关联 的 惟一 之 处 。 再 次 考虑 简单 表达 式 num - num x num 的 分 析 树 。 
Expr 


ee ae 
Expr Op num 
wrt, | 
Expr Op num x 


num, 一 


为 使 讨论 清晰 ， 我 们 在 number 的 实例 中 加 入 下 标 。 计 算 这 一 表达 式 的 一 个 自然 的 方法 是 使 用 简单 的 
后 序 树 遍 历 。 这 将 首先 计算 num-num:， 然 后 再 将 其 结果 乘 以 num:， 生 成 (num,-num,) x num3。 这 一 计算 
顺序 与 代数 课程 所 教授 的 代数 优先 顺序 相 矛 盾 。 标 准 的 优先 顺序 将 按 如 下 顺序 计算 表达 式 : 


num; - (num, x num3) 


因为 分 析 这 一 表达 式 的 最 终 目 标 是 生成 实现 这 一 表达 式 的 代码 ， 表 达 式 的 文法 应 该 具有 这 样 的 性 质 : 它 
构建 的 树 的 “自然 ”遍历 计算 生成 正确 的 结果 。 

这 一 问题 取决 于 这 一 文法 的 结构 。 这 一 文法 按 同一 方式 派生 所 有 的 算术 操作 符 。 为 使 分 析 树 编 码 代 
数 优先 权 ， 我 们 必须 重新 构建 这 一 文法 使 其 适应 正确 的 优先 权 。 

为 了 引入 优先 权 ， 我 们 必须 确定 语言 中 的 适当 优先 权 级 别 。 对 于 我 们 的 简单 表达 式 文 法 ， 我 们 有 两 
个 优先 权 级 别 : + 和 -的 优先 权 低 ， 而 x 和 + 的 优先 权 高 。 我 们 对 每 一 个 优先 权 级 别 指定 不 同 的 非 终结 符 
并 分 离 出 相应 的 文法 部 分 。 


Expr + Term 


Expr - Term 
Term 


—> 
| 
| | 
—  Termxnum 
|  Term+ num 
| 


num 





在 这 里 ，Expr 表 示 由 + 和 -构成 的 低 优先 权 级 别 表达 式 ， 而 Term 则 表示 由 x Fl + 构成 的 高 优先 权 级 


别 表 达 式 。 这 一 文法 按 与 -和 x 相关 的 优先 权 级 别 一 致 的 顺序 派生 num-num: x num: 


规则 句 “型 Expr 
Expr Ps a ae 
2 Expr - Term cs Nth D 
4 Expr - Term x num Term Term X num 
6 Expr - numz x num3 | | 
3 Term - numz x num3 num; num, 
6 num, - num2 x num3 
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这 一 分 析 树 上 的 后 序 树 遍历 首先 计算 num: x nums， 然 后 再 从 numi 中 减 去 这 一 结果 。 这 实现 了 算术 优 
先 权 的 标准 规则 。 注 意 ， 为 强制 优先 权 而 增加 的 非 终结 符 会 增加 分 析 树 的 内 部 结 点 。 同 样 地 ， 用 具体 的 
操作 符 替换 0p 的 出 现 可 以 减少 分 析 树 的 内 部 结 点 。 

为 把 括号 加 入 到 这 一 文法 中 ， 我们 需要 另外 一 个 优先 权 
级 别 。 插 号 的 优先 权 高 于 x 和 +; 这 迫使 我 们 在 评估 括号 表 
达 式 前 面 和 后 面 的 操作 符 之 前 先 评估 括号 内 的 表达 式 。 因 此 ， 
对 于 ax (b-c)， 我 们 先 评估 b-c， 再 把 评估 值 与 a 的 值 相 乘 。 
为 了 把 这 一 功能 插入 到 文法 中 ， 我 们 加 入 另外 一 个 非 终结 符 
Factor。 如 图 3-1 所 示 的 结果 文法 正确 地 表示 +、-、x 、+ 和 
括号 表达 式 的 相对 优先 权 。 我 们 把 这 一 文法 称 为 经 典 表达 式 
文法 (classic expression grammar). 

其 他 操作 需要 高 优先 权 。 例 如 ， 应 该 在 标准 算术 运算 之 
前 运用 数组 下 标 。 这 样 可 以 确保 对 x+y[i] 这 样 的 表达 式 ， 在 
把 y[i] 的 值 加 到 x 上 之 前 评估 下 标的 值 ， 而 不 是 把 i 看 成 位 置 
由 x+y 计 算得 来 的 某 个 数组 的 下 标 。 同 样 地 ， 诸 如 C 或 Java 中 的 强制 类 型 转换 (type cast) 这 样 的 改变 值 
的 类 型 的 操作 的 优先 权 高 于 算术 的 优先 权 ， 但 低 于 括号 和 下 标 运 算 的 优先 权 。 

如 果 语 言 允 许 赋值 出 现 于 表达 式 的 内 部 ， 那 么 这 个 赋值 操作 将 有 低 优先 权 。 低 优先 权 确保 代码 在 执 
行 赋值 之 前 完全 评估 赋值 的 左边 和 右边 。 例 如 ， 如 果 赋 值 (A) 与 加 法 有 同样 的 优先 权 ， 那 么 假设 是 从 
左 到 右 评估 的 话 ， 表 达 式 x<-y+z 在 执行 加 法 之 前 应 把 y 值 赋 给 x。 

3.2.4 发 现 特定 派生 

给 定 文法 G， 我 们 已 经 看 到 如 何 发 现 L(G) 中 的 句子 。 相 反 ， 编 译 器 必须 对 给 定 的 输入 串 推 断 出 一 个 
派生 ， 或 者 确定 这 样 的 派生 不 存在 。 从 特定 输入 句子 出 发 构造 派生 的 过 程 称 为 语法 分 析 (parsing) ©. 

语法 分 析 器 以 某 种 源 语 言 写 成 的 假定 的 程序 作为 输入 。 这 一 程序 对 语法 分 析 器 来 说 表面 上 是 字 及 其 
语法 范畴 的 流 。 因 此 ， 由 经 典 表达 式 文 法 生成 的 语言 的 表达 式 x-2 x y 可 以 如 下 表示 : 

(ident, x) - (num, 2) x (ident, y) 
作为 输出 ， 语 法 分 析 器 产生 输入 程序 的 一 个 派生 或 给 出 输入 不 合法 程序 的 提示 。 因 为 对 于 非 歧 义 语言 ， 


分 析 树 等 价 于 派生 ， 所 以 我 们 可 以 认为 语法 分 析 是 从 输入 串 构 建 分 析 树 的 过 程 。 因 此 ， 经 典 表达 式 文法 
的 语法 分 析 器 可 能 为 表达 式 x-2 x y 构 建 如 下 分 析 树 : 


Expr + Term 
Expr - Term 
Term 

Term x Factor 
Term + Factor 
Factor 

( Expr) 

num 


> 
| 
| 

> 
| 
| 

ut 
| 
| 


ident 


图 3-1 经 典 表 达 式 文法 


Term Term X Factor 


Factor Factor <ident,y> 
<ident,x> <num,2> 


© parsing 通 常 译作 分 析 ， 但 本 书 为 了 区 分 作者 常用 的 parsing 和 analysis 而 把 parsing 译 作 语法 分 析 。 但 作为 修饰 
词 时 译作 分 析 。 同时， 单独 的 parser 译 作 语 法 分 析 器 ， 而 带 修饰 词 时 译作 分 析 器 。 一 一 译 者 注 
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构建 派生 等 同 于 构建 分 析 树 。 分 析 树 的 根 和 叶子 是 已 知 的 。 分 析 树 的 根 必须 是 表示 开始 符号 5 的 结 
点 。 按 照 从 左 到 右 的 顺序 ， 分析 树 的 叶子 必须 是 与 扫描 器 返回 的 字 流 相 匹 配 的 结 点 。 这 一 问题 的 最 难 的 
部 分 是 使 用 嵌入 到 文法 中 的 语言 结构 连结 根 与 叶子 。 有 两 种 刚好 相反 的 构建 分 析 树 的 方法 。 

1) 自 顶 向 下 分 析 器 (top-down parser) 从 根 开 始 构建 并 使 其 向 着 叶子 的 方向 伸展 分 析 树 。 在 每 一 步 ， 
自 顶 向 下 分 析 器 在 树 的 较 低 边缘 上 选择 某 个 非 终 符 结 点 ， 并 从 这 个 结 点 开始 向 下 方 扩展 这 棵 树 。 

2) 自 底 向 上 分 析 器 (bottom-up parser) 从 叶子 开始 构建 并 向 根 的 方向 伸展 分 析 树 。 在 每 一 步 ， 自 
底 向 上 分 析 器 加 入 可 以 使 部 分 树 向 上 方 扩展 的 结 点 。 

无 论 哪 一 种 方法 ， 语 法 分 析 器 都 将 对 产生 式 的 运用 做 出 一 系列 选择 。 在 语法 分 析 中 大 多 数 智能 上 的 
复杂 性 依赖 于 做 出 这 些 选择 的 机 制 。 


3.2.5 上 下 文 无 关 文 法 与 正则 表达 式 的 对 比 


为 了 理解 正则 表达 式 与 上 下 文 无 关 文 法 之 间 的 差异 ， 我 们 把 经 典 表 达 式 文法 与 下 面 的 正则 表达 式 进 
行 对 照 : 
(ident | num) (+ | - |x| +))* (ident | num) 


这 一 正则 表达 式 和 前 述 的 上 下 文 无 关 文 法 都 描述 相同 的 表达 式 集 合 。 

为 了 弄 清正 则 表达 式 与 上 下 文 无 关 文法 之 间 的 差异 ， 考 虑 正则 文法 (regular grammar) 的 概念 。 正 
则 文法 与 正则 表达 式 有 同样 的 表达 能 力 ， 也 就 是 说 ， 它 们 都 刚好 能 够 描述 所 有 正则 语言 。 

一 个 正则 文法 是 一 个 四 元 组 R=(T，NT，5，P)， 其 成 员 的 含义 与 上 下 文 无 关 文 法 相同 。 然 而 在 正则 
文法 中 ，P 中 的 产生 式 局 限于 两 种 形式 ， 或 者 是 4 一 a 或 者 是 4 一 aB， 其 中 4，BENT 且 aE7。 对 产生 式 形 
式 的 限制 给 正则 文法 带 来 另外 一 个 名 字 ， 有 时 它们 被 称 为 左 线性 文法 (left-linear grammar), 

与 此 相反 ， 上 下 文 无 关 文 法 允许 产生 式 的 右 部 包含 (TUNT) 的 任意 多 个 符号 。 因 此 ， 正 则 文法 是 
上 下 文 无 关 文 法 的 真子 集 。 同 样 的 关系 也 存在 于 由 正则 文法 描述 的 正则 语言 ， 和 由 上 下 文 无 关 文法 描述 
的 上 下 文 无 关 语 言 之 间 。 正 则 语言 是 上 王 文 无 关 语 言 的 真子 集 。 本 章 早 前 所 用 的 文法 SheepNoise 是 一 个 
正则 文法 。 

当然 我 们 会 问 : 是 否 存在 可 以 用 上 下 文 无 关 文法 表示 但 不 能 用 正则 文法 表示 的 有 趣 的 程序 设计 语言 
结构 呢 ? 现代 程序 设计 语言 的 很 多 重要 特征 都 陷 和 人 上下文 无 关 文 法 与 正则 文法 之 间 这 一 沟 餐 之 中 。 这 样 
的 例子 包括 匹配 括号 ， 例 如 大 括号 和 圆 括号 以 及 关键 字 配 对 (例如 begin 和 end 的 配对 )。 同 样 重要 的 是 ， 
编译 器 设计 者 可 以 用 上 下 文 无 关 文 法 编码 如 操作 符 优 先 权 和 if-then-e1se 结 构 这 样 的 概念 。 分 析 经 典 表 
达 式 文法 的 表达 式 x-2 x y 导 致 描绘 带 有 期 望 的 评估 顺序 ( x 运算 在 -运算 之 前 ) 的 分 析 树 。 使 用 正则 表 
达 式 识别 同样 的 字符 串 不 给 出 评估 优先 权 的 信息 。 | 

既然 上 下 文 无 关 文 法 可 以 识别 由 正则 表达 式 指定 的 任意 结构 ， 究 竟 为 什么 要 使 用 正则 表达 式 呢 ?” 编 
译 器 设计 者 可 以 把 语言 的 词法 结构 直接 编码 成 它 的 文法 。 有 两 个 因素 使 我 们 倾向 于 分 离 扫描 器 和 分 析 器 。 
第 一 个 因素 是 ， 基 于 DFA 的 识别 器 效率 高 。 它 们 所 花 的 时 间 与 输入 字符 串 的 长 度 成 正比 。 使 用 合理 的 实 
现 技 术 ， 甚 至 渐 近 复杂 度 的 单位 字符 处 理 常 量 ， 即 渐 近 复杂 度 的 系数 也 很 小 。 能 够 处 理 上 下 文 无 关 文法 
的 适当 子 集 的 分 析 器 比 扫描 器 要 复杂 得 多 ， 对 每 个 输入 符号 的 开销 也 高 。 第 二 个 因素 是 ， 扫 描 器 使 用 简 
化 的 输入 文本 ， 这 大 大 减 小 了 上 下 文 无 关 文法 的 复杂 度 。 例 如 ， 扫 描 器 一 般 会 发 现 注释 ， 并 把 它们 从 输 
入 流 中 清除 出 去 。 想 像 一 下 ， 扩 展 经 典 表 达 式 文法 使 其 允许 在 任意 两 个 终结 符号 之 间 存 在 注释 ; 在 扫描 
器 中 识别 并 清除 它们 就 简单 得 多 了 。 对 于 文本 字符 串 也 存在 相同 的 问题 。 | 

因此 ， 为 了 高 效 和 方便 ， 编 译 器 设计 者 使 用 基于 DFA 的 扫描 器 。 把 微 语 法 移 人 上 下 文 无 关 文法 将 扩 
大 文法 ， 增 加 派生 的 长 度 并 使 前 端 变 得 更 慢 。 一 般 地 ， 正 则 表达 式 被 用 于 字 的 分 类 ， 匹 配 正则 模式 ， 清 
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除 具有 内 部 词法 结构 的 对 象 。 当 需要 高 层次 结构 ， 如 匹配 括号 匹配 透露 结构 ， 或 在 上 下 文 间 进行 匹配 时 ， 
上 下 文 无 关 文法 是 绝 好 的 工具 。 



























我 们 根据 文法 分 析 的 难 易 程度 对 上 下 文 无关 文 法 的 集合 进行 层次 划分 。 这 一 层次 划分 有 很 多 等 
级 。 本 章 涉 及 其 中 的 四 个 等 级 ， 分 别 是 任意 的 上 下 文 无 关 文法 、LR(1) 文法 、LL(1) 文法 和 正则 文 
法 。 这 些 集合 存在 媒 套 的 包含 关系 : 上 下 文 无 关 文法 包含 LR(1) 包含 LL(1) 包含 RG ， 如 下 图 所 示 。 

对 任意 的 上 下 文 无 关 文 法 进行 语法 分 析 需 要 比 其 受 限 集合 
LR(1) 或 LL(1) 更 多 的 时 间 。 例 如 ， 分 析 上 下 文 无 关 文法 的 
Earley 算 法 的 最 坏 情况 下 的 时 间 复 杂 度 是 O(n’)， 其 中 是 输入 流 
中 字 的 数量 。 当 然 ， 实 际 运行 时 间 也 许 会 更 好 些 。 编 译 器 设计 者 
历来 都 回避 “普遍 的 ”技术 ， 因 为 我 们 已 经 认识 到 它们 并 不 是 很 
有 效 。 

LR(1) 文法 包含 非 歧 义 上 下 文 无 关 文 法 的 一 个 大 子 集 。 
LR(1) 文法 可 以 使 用 自 底 向 上 的 分 析 ， 从 左 到 右 的 线性 扫描 当前 上 上下文 无 关 文法 
输入 符号 ， 最 多 向 前 看 一 个 字 的 方式 进行 语法 分 析 。 有 若干 从 文 
法 得 到 LR(1) 分 析 器 的 算法 。 自 动 化 这 一 过 程 的 广泛 可 用 的 工具 已 使 LR(1) 分析 器 成 为 “大 家 喜爱 
的 分 析 器 。” 

LLU) 文法 是 LR(1) 文法 的 一 个 重要 子 集 。LL(1) 文法 可 以 使 用 自 顶 向 下 的 语法 分 析 ， 从 左 到 右 | 
的 线性 扫描 ， 向 前 看 一 个 字 的 方式 进行 分 析 。LL(1) 文法 的 两 个 不 同类 型 的 分 析 器 很 受 欢迎 ， 手 编 | 
代码 递归 下 降 分 析 器 和 称 为 LL(1) 分 析 器 的 表 驱 动 分 析 器 。 很 多 有 趣 的 程序 设计 语言 都 容易 使 用 | 
LL(1) 文法 来 表示 。 

正则 文法 刚好 精确 描绘 那些 可 以 用 DFA 识 别 的 语言 。 编 译 器 构造 中 正则 文法 的 主要 用 途 是 描述 | 
扫描 器 。 

儿 平 所 有 程序 设计 语言 的 结构 都 可 以 表示 成 LR(1) 形式 (通常 是 LL(1) 形式 )。 因 此 ， 大 多 数 编 | 
译 器 使 用 基于 上 下 文 无 关 文 法 的 这 两 个 受 限 类 中 的 快速 分 析 算 法 。 | 








3.3 自 项 向 下 分 析 


自 顶 向 下 分 析 器 从 分 析 树 的 根 开 始 ， 并 系统 地 向 下 扩展 分 析 树 直 到 分 析 树 的 叶子 与 扫描 器 返回 的 已 
分 类 字 匹 配 。 在 每 一 点 ， 上 述 过 程 考 虑 已 部 分 建立 起 来 的 分 析 树 。 它 在 这 棵 树 较 低 的 边缘 处 选择 一 个 非 
终结 符 ， 并 通过 加 入 对 应 于 那个 非 终 结 符 的 某 个 产生 式 的 右 部 的 子 结 点 来 扩展 这 个 非 终结 符 。 它 不 扩展 
终结 符 的 边缘 。 这 一 过 程 一 直 进 行 下 去 ， 直 到 下 面 两 种 情况 之 一 发 生 : 

a) 分 析 树 的 边缘 只 包含 终结 符号 ， 并 且 输 入 流 已 被 耗 尽 ; 

b) 在 已 部 分 建立 起 来 的 分 析 树 的 边缘 与 输入 流 之 间 出 现 明确 的 不 匹配 。 

在 第 一 种 情况 下 , 分析 成 功 。 在 第 二 种 情况 下 ， 存 在 两 种 可 能 性 。 在 这 一 过 程 中 的 早 前 的 某 一 步 上 ， 
分 析 器 也 许 选择 了 一 个 错误 的 产生 式 ， 在 这 种 情况 下 回溯 可 以 带 来 正确 的 选择 。 另 一 种 可 能 是 ， 输 入 曲 
不 是 分 析 语 言 中 的 合法 语句 ， 在 这 种 情况 下 回溯 会 失败 ， 而 且 分 析 器 应 该 向 用 户 报告 这 个 语法 错误 。 

一 个 关键 性 的 观察 结果 使 自 顶 向 下 分 析 高 效 : 看 在 上 下 文 无 关 文 法 的 一 个 大 子 全 ， 对 此 从 不 需要 回 
淹 。 本 节 的 后 半 部 分 将 介绍 有 助 于 把 任意 的 文法 转化 成 无 回 蛮 文法 或 预测 文法 的 技术 。 然 而， 首先 我 们 
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介绍 一 个 例子 来 展示 自 顶 向 下 分 析 背 后 的 思想 ， 并 说 明 非 限制 上 下 文 无 关 文法 引发 的 一 些 问题 。 


3.3.1 例子 


图 3-2 给 出 一 个 自 顶 向 下 分 析 的 简单 算法 。 这 一 过 程 完 全 作用 于 分 析 树 的 较 低 边缘 : 这 样 的 边缘 总 
对 应 于 名 型。 在 每 一 步 ， 我 们 选择 扩展 最 左边 的 非 终结 符 。 这 对 应 于 最 左派 生 ， 因 为 这 一 分 析 器 按照 扫 
描 器 产生 字 的 从 左 到 右 的 顺序 考虑 这 些 字 。 


word +- NextWord() 
root + start symbol 
node +- root 
loop forever 
if node € T & node matches word then 
advance node to the next node on the fringe 
word +- NextWord() 
else if node € T & node does not match word then 
backtrack 
else if node € NT then 
pick a rule “node-+8” 
extend tree from node by building B 
node + leftmost symbol in B 


if node is empty & word is eof then 
accept and exit the loop 


else if node is empty & word is not eof then 
backtrack 





图 3-2 最 左 自 顶 向 下 分 析 算法 


为 了 理解 自 顶 向 下 分 析 算法 ， 考 虑 经 典 表达 式 文 法 中 这 一 分 析 器 识别 表达 式 x-2 x ROR. KK 
法 的 目标 符号 是 Expr; 因此 ， 分 析 器 开始 于 一 个 以 Expz 为 根 的 树 。 为 了 展示 分 析 器 的 行为 ， 我 们 对 派生 
的 表格 表示 进行 扩展 。 最 左边 的 一 列 给 出 达到 每 个 状态 所 使 用 的 文法 规则 ; 中 间 一 列 给 出 部 分 构建 起 来 
的 分 析 树 的 较 低 边缘 ， 这 是 最 新 得 到 的 句 型 。 在 右边 ,我们 加 入 了 输入 流 的 一 个 表示 。1 表 明 扫 描 器 的 
fH; 它 处 于 当前 输入 符号 之 前 。 我 们 在 规则 列 中 加 入 两 个 动作 一 和 <-， 分 别 用 来 表示 输入 指针 的 前 进 
和 产生 式 集中 的 回溯 。 语 法 分 析 器 可 能 采取 的 前 几 个 移动 是 : 


规 w 名 型 输 入 
Expr | tx -2xy 

1 Expr + Term tx -2xy 

1 Expr + Term+ Term tx - 2xy 

1 Expr + Term+ -> tx - 2xy 

1 os tx - 2xy 


语法 分 析 器 开始 于 开始 符号 Expr， 使 用 文法 中 的 第 一 个 产生 式 的 右 部 展开 它 。 这 产生 边缘 Expr + 
Term。 为 了 生产 最 左派 生 ， 语 法 分 析 器 必须 展开 这 一 边缘 的 最 左 非 终 结 符 ， 此 时 它 仍 是 Expr。 如 果 语 法 
分 析 器 仍旧 选择 规则 1， 这 将 导致 一 个 无 限 的 展开 序列 ， 其 中 的 每 个 展开 都 不 再 带 来 任何 进展 。 这 对 表 
达 式 文法 的 形式 提出 了 问题 

如 果 在 某 个 产生 式 的 右 部 的 第 一 个 符号 与 它 的 左 部 的 符号 相同 ， 那 么 这 个 产生 式 是 左 递归 的 。 左 递 
归 也 可 以 间接 地 发 生 ， 正 如 我 们 将 在 3.3.3 节 中 看 到 的 那样 。 带 左 递归 的 文法 可 以 使 自 顶 向 下 分 析 器 永远 
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展开 下 去 而 不 带 来 任何 进展 。 

为 了 绕 开 左 递归 问题 并 展示 自 项 向 下 分 析 器 的 另 一 个 潜在 问题 ， 我 们 让 分 析 器 以 任意 一 种 方式 选择 
产生 式 。 实 际 的 实现 无 疑 会 用 确定 且 一 致 的 方式 做 出 这 些 选择 。 例 如 ， 分 析 器 也 许 尝 试 着 把 Expr 重 写成 
ident。 这 生成 展开 序列 : 规则 3 (Expr 一 Term))、 规 则 6 (Term—-Factor) 和 规则 9 (Factor—ident). 


规则 名 ”型 输 入 
一 Expr 1x - 2xy 
3 Term tx- 2xy 
6 Factor tx- 2xy 
9 ident tx - 2xy 
> ident xt- 2xy 


这 时 ， 边 缘 的 最 左 符号 是 终结 符 ， 所 以 分 析 器 检查 这 个 符号 是 否 与 存放 在 word 中 的 当前 的 输入 符号 
相 匹 配 。 因 为 它们 相 匹 配 ， 它 在 边缘 向 右前 进 一 个 符号 ， 并 通过 调用 NextWord 推 进 输入 流 。 遗 憾 的 是 ， 
分 析 树 的 边缘 结束 于 ident ， 而 输入 流 中 的 当前 字 是 -。 这 一 不 匹配 表明 到 此 所 采取 的 步骤 无 法 带 来 一 个 
有 效 的 语法 分 析 。 或 者 是 语法 分 析 器 在 某 个 早 前 的 展开 中 做 了 不 正确 的 选择 ， 或 者 输入 字符 串 不 是 表达 
式 文法 的 合法 句子 。 

语法 分 析 器 通过 回 漳 处 理 这 种 情况 。 如 果 语 法 分 析 器 正在 做 系统 的 选择 ， 那 么 语法 分 析 器 将 取消 最 
新 近 的 动作 ， 在 此 是 通过 规则 9 所 做 的 展开 ， 并 对 Factor 尝 试 其 他 可 能 性 。 当 这 些 都 失败 时 ， 语 法 分 析 
器 取消 规则 6 所 做 的 展开 ， 并 对 Term 尝 试 其 他 可 能 性 。 最 后 ， 语 法 分 析 器 将 对 规则 3 所 做 的 展开 重新 尝试 
其 他 选择 ， 并 发 现 第 一 步 应 该 是 使 用 规则 2 的 展开 Expr 一 Erpr-Term。 

从 这 一 点 开始 ， 语 法 分 析 器 可 以 向 前 工作 ， 运 用 规则 序列 3、6 和 9 从 边缘 的 第 一 个 位 置 的 Expr 派 生 
出 ident。 将 边缘 和 输入 流向 前 移动 ， 语 法 分 析 器 发 现 输入 流 中 的 记号 -与 边缘 的 - 相 匹配 。 


规 R 名 ”型 输 入 
一 Expr ftx- 2xy 
2 Expr - Term tx - 2xy 
3 Term - Term tx -~- 2xy 
6 Factor - Term tx - 2xy 
9 ident - Term tx - 2xy 
> ident - Term x f- 2xy 
一 ident - Term x~- f2xy 


在 此 ， 语 法 分 析 器 将 通过 规则 序列 4、6 和 8 展开 去 与 num 匹 配 ， 并 在 边缘 处 留 下 适当 的 右上 下 文 。 语 
法 分 析 器 能 够 使 边缘 与 num 匹 配 ， 然 后 前 进 并 与 x 匹配 。 最 后 的 展开 使 用 规则 9 把 ident 放 置 在 边缘 处 ， 
与 最 后 的 输入 符号 匹配 。 


规 R 名 型 输 入 
4 ident - Term x Factor x- f2xy 
6 ident - Factor x Factor x- t2xy 
8 ident - num x Factor x- t2xy 
> ident - num x Factor x - 2h xy 
一 ident - num x Factor x- 2 x ty 
9 ident - num x ident x- 2xfy 
一 ident - num x ident x- 2xyf 
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在 此 ， 较 低 的 边缘 只 包含 终结 符 ， 而 且 输 入 已 经 用 尽 。 在 语法 分 析 器 中 ，node 是 空 结 点 且 word 是 eof ， 
所 以 分 析 器 报告 成 功 并 终止。 

(注意 ， 在 语法 分 析 过 程 中 的 很 多 点 也 许 会 做 出 错误 的 展开 ， 引 发 更 多 的 回 滴 。 为 简明 起 见 ， 我 们 
没有 这 样 做 。 然 而 ， 读 者 应 该 考虑 如 果 我 们 按 确定 的 方式 选择 规则 ， 例 如 按 规则 序号 递增 的 顺序 选取 规 
则 的 话 ， 将 会 出 现 多 少 次 回 济 . ) 


3.3.2 自 项 向 下 分 析 的 复杂 因素 


正如 前 面 的 例子 所 展示 的 那样 ， 若 干 问题 可 能 使 自 项 向 下 分 析 器 的 使 用 复杂 化 。 左 递归 文法 引发 终 
止 问 题 。 选 择 错误 的 展开 必然 导致 回溯 .一般 地 ， 关 键 问题 是 在 每 步 都 要 确保 语法 分 析 器 能 够 选择 出 正 
确 的 产生 式 来 展开 分 析 树 边缘 的 生长 。 

书写 无 回 渊 文法 需要 小 心 。 文 法 必须 避免 左 递 归 。 文 法 还 必须 确保 单一 向 前 看 符号 在 每 步 足以 确定 
正确 的 展开 。 以 下 两 小 节 详 细 讨论 这 些 问 题 。 


3.3.3 消除 左 递 归 


左 递 归 文 法 可 能 在 不 生成 终结 符号 的 情况 下 展开 边缘 , 从 而 使 确定 的 自 顶 向 下 分 析 器 产生 无 穷 循环 。 
因为 只 有 当 边 缘 上 的 终结 符号 与 当前 输入 符号 之 间 不 匹配 时 引发 回潮， 所 以 分 析 器 不 能 从 由 左 递归 导致 
的 展开 中 恢复 。 

幸运 的 是 ， 我 们 可 以 机 械 地 修改 一 个 文法 以 消除 左 递归 。 对 于 如 下 图 左边 所 示 的 直接 左 递归 ， 我 们 
如 下 图 右边 所 示 的 那样 使 用 右 递 归 重 写 它 。 


Fee — Feea Fee —» £ Fie 
| 8 ' Fie —» aFie 
| € 
这 一 转换 引入 一 个 新 的 非 终结 符 Fie， 并 把 递归 转移 到 Fie 上 。 它 还 加 入 规则 Fie->e，、 其 中 表示 空 字符 串 。 


在 分 析 算 法 中 se 产生 式 需 要 仔细 的 解释 。 如 果 语 法 分 析 器 使 用 规则 Fie->e 进 行 展开 ， 那 么 效果 是 沿 着 分 析 
树 的 边缘 使 当前 节点 node 到 达 下 一 个 位 置 。 





| Factor + Factor Term’ 


在 表达 式 文法 中 ， 直 接 左 递归 出 现 于 Expr 和 Term 的 产生 式 中 。 
原 规则 . 变换 后 的 规则 
Expr — Expr+Term Expr > Term Expr' 
| Expr- Term Expr' 一  +TermExpr' 
| Term | - Term Expr’ 
| € 
Term — Termx Factor Term = Factor Term’ 
| Term+ Factor 7 Term' ~ xFactor Term’ 
| 
| 


€ 





把 这 些 替 换 放 回 到 经 典 表 达 式 文法 导致 图 3-3 所 示 的 这 个 文法 的 右 递归 变形 。 新 文法 与 经 典 表 达 式 
文法 描述 相同 的 表达 式 集合 ， 但 是 它 使 用 的 是 右 递 归 。 它 对 自 顶 向 下 分 析 器 很 有 用 。 
这 一 转换 消除 直接 左 递归 。 诸 如 ao 一 8B、6 一 7 和 7 一 ca6 等 规则 链 结合 会 生成 cc6 的 情况 ， 所 以 也 可 
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能 出 现 间接 的 左 递归 。 这 样 的 间接 左 递 归 不 总 是 很 明显 ; 它 可 能 产生 于 一 个 长 的 产生 式 链 ， 从 而 被 隐蔽 
起 来 。 

为 了 把 这 些 间 接 左 递归 转换 成 右 递归 ， 我 们 需要 一 个 更 
系统 的 检查 方法 。 图 3-4 给 出 可 以 达到 这 一 目标 的 算法 。 这 
一 算法 假设 原来 的 文法 没有 循环 (A 一 *4) 和 产生 式 (Ae). 

这 一 算法 为 非 终 结 符 强加 一 个 任意 的 顺序 。 外 部 循环 就 
以 这 一 顺序 处 理 所 有 非 终 结 符 。 而 内 部 循环 对 于 每 个 A; 一 Ajy 
(j<i) 型 的 产生 式 ， 展 开 其 右 部 的 4;。 这 样 的 展开 可 能 导致 
间接 的 左 递归 。 为 了 避免 这 样 的 左 递归 ， 这 一 算法 用 左 部 是 
4 的 所 有 可 能 产生 式 的 右 部 取代 4 的 出 现 。 也 就 是 说 ， 如 果 
内 部 循环 发 现 一 个 产生 式 A, 一 Ajy， HA; ôl] lô, 那么 它 
用 产生 式 集合 4A, 一 61y|6,y|…|6:y 取 代 前 面 的 产生 式 。 这 最 终 
把 每 个 间接 左 递归 转换 成 直接 左 递归 。 在 外 循环 的 最 后 一 步 
使 用 前 述 的 简单 转换 方法 把 任意 开始 于 4, 的 直接 左 递归 转换 图 3-3 经 典 表达 式 文法 的 右 递归 变形 
成 右 递 归 。 因 为 只 有 在 最 后 才 加 入 新 的 非 终结 符 ， 并 且 它 只 
包含 右 递 归 ， 所 以 循环 可 以 忽视 它们 : 它们 无 需 检查 和 转换 。 


Term Expr’ 
+ Term Expr’ 
- Term Expr’ 
€ 
Factor Term' 
x Factor Term’ 
+ Factor Term! 
€ 

.( Expr) 
num 
ident 


一 
a 
| 
| 
一 
一 
| 
| 
一 
| 
| 





assume the nonterminals are ordered arbitrarily 
Al, A2, sey An 
fori+ Iton 
forj ltoi-1 
if 3 a production 4i 一 417 then 
replace it with one or more productions 
that expand Aj 
use the direct transformation to eliminate 
any immediate left recursion on A; 












图 3-4 一 般 左 递归 的 消除 
考虑 外 部 循环 的 循环 不 变量 可 以 使 这 一 过 程 更 清晰 。 在 第 ;次 外 部 循环 迭代 
VK<i， 对 !<K 不 存在 右 部 含 4 的 展开 4 的 规则 


在 这 一 过 程 的 末尾 (i=n 时 )， 通 过 反复 使 用 内 部 循环 ， 所 有 间接 左 递归 都 已 被 消除 ， 在 每 次 迭代 的 最 
后 一 步 ， 所 有 直接 左 递归 都 被 消除 。 


3.3.4 消除 回 淹 


使 用 右 递 归 表 达 式 文法 ， 自 项 向 下 分 析 器 能 够 不 回溯 而 处 理 字 符 串 x-2 x y。 事 实 上 ， 右 递归 表达 式 
文法 避 开 所 有 对 回溯 的 需要 。 为 了 看 到 这 一 点 ， 考 虑 语法 分 析 器 是 如 何 通 过 回溯 撤回 动作 的 。 

当 分 析 器 选择 展开 一 个 部 分 构建 起 来 的 分 析 树 的 较 低 边缘 所 用 的 产生 式 时 ， 就 会 发 生 至 关 重 要 的 选 
择 问题 。 当 分 析 器 试图 展开 某 个 非 终 结 符 4 时 ， 它 必须 选择 一 个 型 为 4 一 6 的 规则 。 如 图 3-2 所 示 的 算法 随 
机 选取 这 样 的 规则 。 然 而 ， 如 果 语 法 分 析 器 总 能 够 选 出 适当 的 规则 ,那么 它 就 可 以 避免 回溯 。 

在 右 递 归 表达 式 文 法 中 ， 语 法 分 析 器 总 是 可 以 通过 将 输入 流 中 下 一 字 同 对 应 于 边缘 处 最 左 非 终 结 符 
的 右 部 进行 比较 而 做 出 正确 的 选择 。 根 据 这 种 规律 ， 对 于 右 递 归 表达 式 文 法 ， 我 们 可 以 如 下 构建 x-2 xy 
的 分 析 。 
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m m 句 “型 输 入 

Expr tx-2xy 
1 Term Expr’ tx-2xy 
5 Factor Term’ Expr’ tTx-2xy 
11 ident Term’ Expr’ tTx-2xy 
> ident Term’ Expr’ x 个 -2xy 
8 ident Expr’ xft-2xy 
3 ident - Term Expr’ xt-2xy 
> ident - Term Expr’ x-fT2xy 
5 ident - Factor Term’ Expr’ x-T2xy 
10 ident - num Term’ Expr’ x -个 2 xy 
+ ident - num Term’ Expr’ x-2txy 
6 ident - num x Factor Term’ Expr’ x-27%xy 
> ident - num x Factor Term' Expr’ x-2xty 
11 ident - num x ident Term’ Expr’ x-2xTty 

ident - num x ident Term’ Expr’ x-2xyft 
8 ident - num x ident Expr’ x-2xyft 
4 ident - num x ident x-2xyft 


前 两 个 展开 是 显然 的 ; 在 这 两 种 情况 下 ， 文 法 只 有 一 个 展开 最 左 非 终 结 符 的 规则 。 扩 展 Factor 到 
ident 需 要 一 个 选择 ; 检查 输入 流 中 当前 字 使 选择 明确 。 在 此 ， 语 法 分 析 器 面临 着 Term' 的 展开 ， 且 -为 
当前 输入 字 。 规 则 6 和 规则 7 不 匹配 ， 所 以 语法 分 析 器 选择 规则 8。 现 在， 语法 分 析 器 面临 着 Expr' 的 展开 
以 及 输入 字 -。 这 与 规则 3 匹配 ， 所 以 语法 分 析 器 使 用 规则 3 的 右 部 展开 它 。 使 用 输入 符号 引导 选择 ， 这 
一 过 程 继 续 下 去 ， 直 到 语法 分 析 器 达到 它 的 接受 状态 。 

我 们 可 以 形式 化 右 递归 表达 式 文法 无 回溯 的 性 质 。 在 分 析 过 程 的 每 一 点 ， 展 开 的 选择 是 显然 的 ， 因 
为 最 左 非 终结 符 的 每 种 选择 会 导致 一 个 不 同 的 终结 符 。 对 照 输入 流 中 的 下 一 个 字 和 那些 可 选 的 右 部 就 可 
显露 出 正确 的 展开 。 

这 一 直观 想法 很 容易 刻画 。 如 下 定义 TU NTU {e} 上 的 FIRST 集 合 。 对 于 符号 4， 定义 FIRST(Q) 为 从 
c 派 生出 的 串 中 的 作为 第 一 个 符号 的 字 所 组 成 的 集合 。 考 虑 Expr' 的 规则 : 


> + Term Expr’ 
| - Term Expr' 


| € 





这 些 产生 式 都 有 惟一 的 FIRST 集 合 。 对 于 终结 符号 + 和 -， 它 们 的 FIRST 集 合 只 包含 一 个 元 素 ， 那 就 是 这 
个 符号 本 身 。e 产 生 式 引 发 一 个 很 困难 的 问题 。 这 一 产生 式 不 能 派生 出 任何 终结 符 ， 所 以 FIRST(s) 只 包 
含 e。 但 是 e 从 不 在 输入 流 中 出 现 。 

对 于 e 产 生 式 ， 语 法 分 析 器 必须 将 下 一 个 字 与 可 能 出 现 于 边缘 中 e 的 直接 右 部 (或 等 价 地 到 达 Expr' 的 
直接 右 部 ) 的 符号 集合 比较 。 在 这 种 情况 下 ， 这 个 集合 将 是 某 个 产生 式 的 右 部 中 跟 在 Expr' 后 面 的 符号 派 
生出 的 符号 的 集合 。 如 果 这 个 Expr' 的 右 部 的 符号 可 以 派生 出 8s， 那 么 分 析 器 还 必须 考虑 它 右 部 的 符号 ， 
以 此 类 推 ， 直 到 语法 分 析 器 发 现 不 能 派生 出 8 的 符号 。 设 FOLLOW(A4) 为 合法 句子 中 可 能 出 现 于 非 终结 符 
A 的 直接 后 面 的 符号 组 成 的 集合 。 在 这 一 文法 中 ，FOLLOW(Expr') 是 {eof, )}。 





语法 分 新 57 


无 回溯 的 条 件 依赖 于 FIRST 和 FOLLOW 集 合 。 图 3-5 给 出 计算 这 些 集合 的 算法 。FIRST 集 合 必须 在 
FOLLOW 集合 之 前 计算 。 因 为 FOLLOW 集合 的 计算 依赖 于 FIRST 集 合 的 计算 。 二 者 的 计算 可 以 公式 化 为 
不 动 点 计算 。 


foreacha € (TUe) 
FIRST(a) + a 
foreach A € NT 
FIRST(A) 一 0 
while (First sets are still changing) 
for each p € P, where p has the form A+ 
if B is Bıßb2 . .. Bg, where Bi € TUNT, then 
FIRST(A) + FIRST(A) U (FIRST(B) — {e}) 
iel 
while (e € FIRST(B;) and i < k-1) 
FIRST(A) + FIRST(A) U (FIRST(G;+1) ~ {e}) 
ieitl 


if i= k and e € FIRST(@,) 
then FIRST(4) + FIRST(A) U {e} 


for each A € NT 
FOLLOW(A) + 0 
FOLLOW(S) + {eof} 
while (FOLLOw sets are still changing ) 
for each p € P of the form A > B,B2-++ Be 
FOLLOW(G;) 二 FOLLOW(Bk) U FOLLOW(A) 
TRAILER + FOLLOW(A) 
for i + k down to 2 
if € € FIRST (fi) then 
FOLLOW(4;-1) + FOLLOW(6;_1) U 
{FIRST(§;) — e} U TRAILER 
else - 
FOLLOW(G;_1) 二 FOLLOW(8;—1) U FIRST(§;) 
TRAILER + @ 





图 3-5 计算 FIRST 和 FOLLOW 集合 


我 们 可 以 使 用 FIRST 和 FOLLOW 集合 精确 地 公式 化 无 回溯 文法 必须 满足 的 条 件 。 如 下 定义 集合 
FIRST*(a): 若 FIRST(a) 不 包含 s， 则 为 FIRST+(a) = FIRST(a) ， 否 则 为 FIRST+(a) =FIRST(a) U 
FOLLOW(a)。 于 是 ， 一 个 文法 有 无 回溯 性 质 的 条 件 是 ， 对 于 任意 带 有 多 个 右 部 4 一 外 ip:|…|8, 的 非 终结 
符 4， 它 满足 下 式 : 


FIRST+ (6;) N First*(6))=0, Vl<i<j<n 


因为 FIRST 集 合 是 定义 在 文法 符号 上 而 不 是 定义 文法 符号 的 串 上 的 ， 所 以 我 们 把 FIRST(B) 解释 成 6 的 第 
一 个 符号 的 FIRST 集 合 。 上 面 的 规则 刻画 了 无 回调 性 质 。 

例如 ， 考 虚 扩 展 右 递归 表达 式 文法 ， 使 其 包含 标量 变量 引用 、 数 组 元 素 引 用 和 函数 调用 的 语法 。 为 
了 扩展 这 一 文法 ， 我 们 用 描述 标量 变量 引用 、 数 组 元 素 引 用 和 函数 调用 语法 的 产生 式 集合 取代 产生 式 
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ident 

ident [ ExprList ] 
ident ( ExprList ) 
Expr , ExprList 
Expr 





这 些 产 生 式 使 用 方 括号 来 标记 数组 引用 ， 用 圆 括号 来 标记 函数 调用 。 

上 述 文法 片段 不 满足 无 回溯 条 件 ， 因 为 产生 式 11、12 和 13 都 开始 于 ident 。 它 们 的 右 部 的 FIRST 集 
合 是 相同 的 。 当 分 析 器 尝试 展开 分 析 树 较 低 边缘 的 Factor 时 ， 通 过 只 向 前 看 一 个 字 分 析 器 无 法 区 分 11、 
12 和 13。( 当然 ， 向 前 看 两 个 字 可 以 使 它 能 够 预测 正确 地 展开 。) 

正 由 于 很 多 文法 不 满足 无 回溯 条 件 ， 我 们 可 以 重 写 文法 ,- 使 其 即 不 改变 语言 又 无 文法 回溯 。 下 面 的 
重 写 版 本 就 是 如 此 : 





u Factor 一“ „ident Arguments 
Arguments — [ExprList] 
| ( ExprList ) 
| € 
1 ExprList > Expr, ExprList 
16 | Expr 


这 一 版 本 的 文法 把 派生 分 成 两 步 ， 一 步 识 别 三 个 原始 右 部 的 公共 前 缀 ident ， 另 外 一 步 包含 三 个 不 同 选 
项 。 为 了 实现 这 一 点 ， 我 们 引入 了 一 个 新 的 非 终 结 符 Arguments， 并 把 [，( 和 e 合 加 到 Arguments 的 右 部 。 
我 们 称 这 一 转换 为 ident 的 左 因子 分 解 (left-factoring )。 
我 们 可 以 把 这 一 转换 运用 到 任意 文法 上 。 图 3-6 给 出 完成 这 一 工作 的 一 个 简单 的 算法 。 这 一 算法 系 
统 地 识别 有 两 个 或 多 个 产生 式 公共 前 绥 的 非 终 结 符 并 分 解 展 开 这 个 非 终结 符 的 产生 式 。 因 此 ， 如 果 这 一 
算法 找到 有 如 下 产生 式 的 非 终结 符 A， 
A> af; | aB2|--+|aBn ly ly 1% 
其 中 a 是 公共 前 级， 的 表示 不 开始 于 a 的 右 部 ， 那 么 算法 使 用 如 下 产生 式 组 取代 这 些 产 生 式 
A eB ly 
B 一 Bıļbz2l--| bn 
其 中 8 是 一 个 新 的 非 终结 符 。repeat 循 环 的 下 一 次 迭代 还 将 考虑 B 的 左 因子 分 解 。 当 这 一 算法 再 也 找 不 
到 公共 前 级 时 就 终止 。 
foreach A € NT 
if a common prefix exists for two or more 
right-hand sides for A then 


find the longest common prefix a 
left-factor a out of the right-hand sides for A 


repeat until no common prefixes remain 





图 3-6 
左 因子 分 解 可 以 把 那些 需要 回溯 的 文法 转换 成 无 回 渊 文法 。 然 而 ， 并 非 所 有 上 下 文 无 关 语 言 都 能 够 
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用 无 回溯 文法 表示 。 使 用 左 递 归 消 除 和 左 因子 分 解 ， 我 们 也 许 能 够 把 一 个 文法 转换 成 可 以 预测 分 析 的 形 
式 。 然 而 一 般 地 ， 上 下 文 无 关 语 言 是 否 有 无 回溯 文法 是 不 可 解 的 。 


3.3.5 自 项 向 下 递归 下 降 分 析 器 


给 定 一 个 预测 文法 G， 我 们 可 以 为 G 手 工 构造 递归 下 降 分 析 器 。 一 个 递归 下 降 分 析 器 是 一 组 交互 递 
归 的 过 程 ， 每 个 过 程 对 应 文法 中 的 一 个 非 终结 符 。 101 


预测 分 析 器 和 DFA 的 比较 


预测 分 析 是 DFA 类 型 的 推断 到 语法 分 析 器 的 一 种 自然 扩展 。DFA 基 于 下 一 个 输入 字符 进行 转换 。 
预测 分 析 器 要 求 展 开 由 输入 流 中 的 下 一 个 字 惟 一 确定 。 因 此 ， 对 于 文法 中 的 每 个 非 终结 符 ， 必 须 存 
在 从 任意 可 接受 输入 字符 串 中 的 第 一 个 字 到 导致 这 个 字符 串 的 一 个 派生 的 特定 产生 式 的 惟一 映射 。 
DFA 与 可 预测 分 析 文 法 即 LL(1) 文法 间 能 力 的 实际 差异 来 自 于 这 样 的 事实 : 一 个 预测 可 以 导致 一 个 





带 有 很 多 符号 的 右 部 ， 而 在 正则 文法 中 ， 它 只 预测 一 个 符号 。 这 使 得 预测 文法 包含 诸如 p 一 (p) 这 样 
的 产生 式 ， 这 一 产生 式 超出 了 正则 表达 式 的 描述 范畴 。( 回想 一 下 正则 表达 式 能 够 识别 CE, BÆ 
这 并 不 表示 开 括号 和 闭 括号 的 数目 必须 匹配 )。 

当然 ， 手 工 构造 的 递归 下 降 分 析 器 可 以 使 用 任意 技巧 来 惟一 确定 产生 式 的 选择 。 例 如 ， 如 果 特 
定 的 左 部 不 能 通过 一 个 向 前 看 符号 来 预测 ， 那 么 语法 分 析 器 可 以 使 用 两 个 向 前 看 符号 。 只 要 明智 地 
做 ， 这 不 会 引发 问题 。 . 





非 终 结 符 4 的 过 程 识别 输入 流 中 4 的 实例 。 为 了 完成 这 一 识别 ，4 的 过 程 调用 识别 4 的 右 部 各 非 终 结 
符 的 过 程 。 
考虑 G 中 的 一 组 产生 式 4 一 外 8:|s。 因 为 G 是 可 预测 的 ， 只 使 用 一 个 输入 字 和 FIRST"* 集 合 ， 分 析 器 就 
能 够 选择 适当 的 右 部 (B,、p., 或 e 中 的 一 个 )。 因 此 ， 识 别 4 的 过 程 应 该 包含 检查 每 一 个 可 选择 的 右 部 的 
代码 。 这 可 以 是 如 下 形式 : 102 
/* find an A*/ 
if (word € Firstt(@,)) then 
look for a Bi 
else if (word € FIRST* (62)) then 
look for a B2 
else if (word € FOLLOW(A)) then 
return true 
else 
report an error -~= 
return false 
分 析 器 必须 用 不 同 于 处 理 其 他 右 部 的 方式 处 理 e 产 生 式 。 
每 个 右 部 B 的 代码 必须 依次 识别 B, 中 的 每 个 文法 符号 。 如 果 这 一 符号 是 终结 符 ， 那 么 分 析 器 就 可 直 
接 用 输入 字 与 这 一 终结 符 比 较 。 如 果 二 者 匹配 则 继续 分 析 下 去 ; 如 果 二 者 不 匹配 则 表明 有 一 个 错误 。 如 
果 这 一 符号 是 非 终止 的 ， 那 么 分 析 器 调用 识别 这 一 非 终结 符 的 过 程 。 它 对 应 于 成 功 或 失败 分 别 返回 真 或 
假 。 另 外 ， 如 果 成 功 则 继续 分 析 下 去 。 如 果 识别 过 程 返回 假 ， 那 么 当前 的 过 程 也 应 该 返回 假 。 发 现 不 匹 
配 的 过 程 可 以 立即 报告 一 个 错误 。 
对 于 右 部 B=cDE， 其 中 cET， 且 D，EENT, 识别 过 程 需 要 去 识别 一 个 c<， 然 后 是 一 个 D， 最 后 是 一 个 
E。 在 这 一 代码 片段 中 ， 我 们 用 “7ook for a B,” 抽 象 这 些 动 作 。 在 处 理 B 的 过 程 Parse_4 的 代码 如 下 所 示 : 
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if (word € First*(,)) then 
if (word # c) then 
report an error finding c in cDE 
return false 
else /* word is c */ 
word + NextWord() 
if (Parse_DQ) = true) 
then return Parse_EQ) 
else return false 


Parse_A 对 4 的 每 个 可 选择 右 部 包含 一 个 类 似 的 代码 片段 。 

构造 完整 的 递归 下 降 分 析 器 的 策略 是 显然 的 。 对 于 每 个 非 终结 符 ， 我 们 构造 一 个 识别 这 个 非 终结 符 
的 过 程 。 每 个 过 程 依赖 于 识别 其 他 非 终结 符 的 其 他 过 程 , 而 且 直 接 测 试 这 一 非 终结 符 右 部 所 有 的 终结 符 。 
图 3-7 给 出 3.3.3 节 中 得 到 的 预测 文法 的 一 个 自 顶 向 下 递归 下 降 分 析 器 。 类 似 右 部 的 代码 已 经 结合 在 一 起 。 


过 程 NextWord() 是 扫描 器 的 递增 接口 。 


MainQ) 
/* Goal — Expr */ 
word +- NextWord(); 
if (Expr() and word = eof) 
then proceed to the next step 
else return false 


Expr() 
/* Expr — Term Expr’ */ 
if (Term() = false) 
then return false 
else return EPrime() 


EPrimeQ 
/* Expr'— + Term Expr’*/ 
/* Expr'— - Term Expr'*/ 
if (word = + or word = -) then 
word +- NextWord() 
if (Term(Q = false) 
then return false 
else return EPrime() 
A Expr'+¢*/ 
return true 


Term() 
/* Term > Factor Term’ */ 
if (Factor() = false) 
then return false 
else return TPrime() 





TPrimeQ 
/* Term’ > x Factor Term’ */ 
/* Term'— + Factor Term’ */ 
if (word = x or word = + ) then 
word + NextWord() 
if (Factor() = false) 
then return false 
else return TPrime() 
/* Term'-> e */ _ 
réturn true 


Factor() 
/* Factor => ( Expr) */ 
if (word = () then 
word 二 NextWord() 
if (Expr() = false) 
then return false 
else if (word + )) then 
report syntax error 
return false 


/* Factor > num */ 


/* Factor + ident */ 
else if (word # num and 
word # ident) then 
report syntax error 
return false 


word 二 NextWord() 


_ return true 


图 3-7 表达 式 的 递归 下 降 分 析 器 


1. 自动 化 递归 下 降 分 析 器 

自 顶 向 下 递归 下 降 分 析 通常 被 认为 是 手工 构造 分 析 器 的 技术 。 当 然 ， 我 们 能 够 构建 自动 生成 适当 文 
法 的 自 顶 向 下 递归 下 降 分 析 器 的 分 析 器 生成 器 。 分 析 器 生成 器 会 为 文法 构造 FIRST 和 FOLLOW 集合 ， 检 
查 每 一 个 非 终 结 符 以 确保 它 的 可 选 右 部 有 互 不 相交 的 初始 终结 符 集合 ， 并 对 文法 中 的 每 一 个 非 终结 符 生 
成 适当 的 分 析 过 程 。 这 一 结果 的 语法 分 析 器 具有 自 项 向 下 递归 下 降 分 析 器 的 优点 ， 诸 如 高 速 、 代 码 空间 
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局 部 化 和 良好 的 错误 检测 等 等 。 它 还 应 该 具有 文法 生成 系统 的 优点 ， 诸 如 简明 、 高 级 描述 以 及 降低 实现 
的 工作 量 等 等 。 . 
预测 分 析 的 代价 与 分 析 树 的 大 小 及 在 每 次 展开 时 选择 正确 右 部 所 需要 的 时 间 量 成 正比 。 为 了 减 小 后 
者 的 代价 ， 编 译 器 设计 者 可 以 把 嵌 套 的 1 语句 修改 成 关于 当前 字 的 选择 语句 。 如 果 能 用 适当 的 方法 翻译 
选择 语 名 的话， 那么 这 可 以 产生 更 有 效 的 代码 。 
另外 ， 编 译 器 设计 者 也 可 以 构造 刻画 这 些 动作 的 表格 。 例 如 ， 对 于 右 递归 表达 式 文 法 ， 分 析 器 有 三 


种 Factor 展 开 : (Expr)，ident 和 num。 使 用 表格 形式 ， 这 可 以 如 下 表示 : 





Factor 


其 中 ,第 一 行 是 终结 符号 列表 ， 而 所 有 的 条 目 或 者 是 规则 编号 或 者 是 表示 一 个 语法 错误 的 破 折 号 (-). 
这 张 表 格 作 为 当前 输入 符号 函数 预测 Factor 的 可 能 展开 。 

如 果 我 们 扩张 这 张 表格 使 其 包含 所 有 非 终 结 符 ， 那 么 图 3-8 中 的 算法 可 以 使 用 这 张 表格 来 完成 自 顶 
向 下 的 表 驱 动 分 析 。 结 果 语 法 分 析 器 是 一 个 表 驱 动 LL(1) 分 析 器 。 名 字 LL(1) 得 自 于 这 样 的 语法 分 析 器 
AERA (L) 扫描 它们 的 输入 ， 并 构造 一 个 最 左派 生 (L)， 并 使 用 一 个 向 前 看 符号 (1) 的 事实 。 可 以 
ALLO) 分 析 的 文法 通常 被 称 为 LL(1) Xk. REEL, LLO) 文法 是 无 回 滴 的 。 


word + NextChar() 
push eof onto stack 
push Start Symbol onto stack 
TOS + top of stack 
` loop forever 
if TOS = eof and word = eof 
then report success and exit the loop 
else if TOS is a terminal or eof then 
if TOS matches word then 
pop the stack f 
word + NextWord() 
else 
report an error looking for TOS 
else /* TOS is a nonterminal */ 
if Table[TOS,word] is A => Bı Bə- -- By then 
pop the stack 
fori -kto 1 by-1 
push B; onto the stack 
else 
report an error expanding TOS 
TOS ¢ top of stack 





图 3-8 LL(1) 框架 分 析 器 


为 了 构建 LL(1) 分 析 器 的 表格 ， 编 译 器 设计 者 必须 计算 FIRST 和 FOLLOW 和 集合， 然后 填写 表格 的 每 
一 个 条 上 自 。 对 于 Tab7e[X，y] ， 其 中 X 是 一 个 非 终 结 符 而 y 是 一 个 终结 符 ， 如 果 yEFIRST*(B6)， 那 么 条 目 应 
该 是 产生 式 X 一 的 规则 编号 。 如 果 X 一 e 也 在 文法 中 ， 那 么 FOLLOW(X) 中 的 每 个 终结 符 的 条 目 应 该 是 这 
个 e 产 生 式 的 规则 编号 。 没 有 被 这 些 规则 定义 的 所 有 条 目 都 是 错误 条 目 。 如 果 有 多 次 定义 的 条 目 ， 那 么 
构造 失败 。 i 
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所 有 构造 成 功 的 文法 都 是 LL(1) 文法 。 结果 表 格 可 以 直接 用 于 得 到 基于 图 3-8 的 框架 分 析 器 的 分 析 器 。 
这 一 文法 也 适合 于 自 顶 向 下 递归 下 降 分 析 器 。 

2. 总 结 

预测 分 析 是 重要 的 ， 因 为 大 多 数 程序 设计 语言 结构 可 以 用 无 回 渊 文法 表示 。 在 实践 中 ， 对 非 终结 符 
的 各 右 部 有 不 同 FIRST 集 合 的 限制 不 对 LL(D 文法 的 有 效 性 产生 太 多 的 制约 。 我 们 给 这 些 文法 构建 的 语 
法 分 析 器 都 很 简洁 且 有 效 。 它 们 可 以 对 错误 的 输入 产生 高 质量 的 诊断 信息 。 对 于 小 型 语言 以 及 良好 的 错 
误 信 息 至 关 重 要 的 情况 ， 自 顶 向 下 递归 下 降 分 析 器 是 一 个 可 行 的 选择 。 


3.4 自 底 向 上 分 析 


自 底 向 上 分 析 器 从 分 析 树 的 叶子 出 发 并 向 它 的 根部 来 构建 分 析 树 。 当 它 遇 到 输入 流 中 的 每 个 字 时 ， 
它 构 造 一 个 叶 结 点 。 这 些 叶 结 点 形成 分 析 树 的 基础 。 为 了 构造 派生 ， 自 底 向 上 分 析 器 以 由 文法 和 输入 流 
共同 指定 的 结构 ， 在 叶子 的 上 方 层 层 加 入 非 终 结 符 。 这 一 部 分 构建 起 来 的 分 析 树 的 上 部 边缘 称 为 它 的 上 
边界 (upper frontier)。 这 一 过 程 向 着 树 的 根部 向 上 延伸 上 边界 。 

在 延伸 的 每 一 步 ， 语 法 分 析 器 寻找 与 文法 中 的 某 个 产生 式 的 右 部 匹配 的 上 边界 的 一 个 截取 。 当 它 找 
到 一 个 匹配 时 ， 语 法 分 析 器 就 构建 一 个 表示 该 产生 式 左 部 非 终结 符 的 结 点 ， 并 加 入 从 该 结 点 到 表示 右 部 
符号 的 结 点 的 边 。 因 为 产生 式 的 左 部 只 有 一 个 非 终结 符 ， 这 些 向 上 的 扩展 用 单一 符号 取代 上 边界 上 的 一 
个 或 多 个 符号 。 语 法 分 析 器 重复 这 一 过 程 ， 直 到 出 现下 面 的 两 个 条 件 之 一 : 

1) 上 边界 减少 到 表示 这 一 文法 开始 符号 的 单一 结 点 。 如 果 语 法 分 析 器 已 匹配 输入 中 的 所 有 字 ， 那 
么 输入 是 语言 中 的 合法 句子 。 如 果 某 些 字 剩 余下 来 ， 那 么 输入 不 是 合法 句子 。 相 反 ， 它 是 一 个 合法 句子 
后 面 跟着 额外 的 字 ， 语 法 分 析 器 应 该 向 用 户 报告 这 一 错误 。 

2) 找 不 到 匹配 。 因 为 语法 分 析 器 还 不 能 为 输入 流 构 建 一 个 派生 ， 输 入 不 是 合法 句子 。 语 法 分 析 器 
应 该 向 用 户 报告 这 一 失败 。 分 析 树 的 上 边界 包含 可 以 用 于 构建 诊断 消息 的 信息 。 

”成 功 的 语法 分 析 贯 串 派生 的 每 一 步 。 失 败 的 语法 分 析 当 它 没有 找到 下 一 步 时 停止 ， 在 这 一 点 它 可 以 
使 用 从 树 中 收集 起 来 的 上 下 文 来 生成 有 意义 的 错误 信息 。 在 很 多 情况 下 ， 语 法 分 析 可 以 从 错误 中 恢复 并 
继续 分 析 ， 这 样 它 可 以 在 一 次 分 析 过 程 中 发 现 尽 可 能 多 的 语法 错误 ( 见 3.6.1 节 )。 

自 底 向 上 分 析 器 中 的 派生 开始 于 目标 符号 并 逐渐 得 到 一 个 句子 。 因 为 语法 分 析 器 自 底 向 上 地 建立 分 
析 树 ， 所 以 它 以 相反 的 顺序 发 现 派生 步骤 。 如 果 派 生 是 由 产生 如 下 句 型 的 一 系列 步 晴 组 成 的 


So= Nnn Nn ry, =F, - 


ABZ REEDA RERA nY ZRA WA A E EEA BK — ME. RES 
析 器 必须 将 这 些 由 六 -一 % 指 明 的 结 点 加 入 到 上 边界 上 ， 而 且 必 须 是 在 它 发 现任 何 包含 这 些 结 点 的 匹配 
之 前 。 因 此 ， 它 只 能 按 逆向 派生 的 顺序 发 现 结 点 。 

因为 扫描 器 是 按 从 左 到 右 的 顺序 寻找 输入 流 中 的 字 ， 语 法 分 析 器 就 应 该 以 左 到 右 的 顺序 检查 叶子 。 
这 就 给 出 从 右 到 左 产生 终结 符 的 派生 顺序 ， 使 得 它 的 逆 顺 序 与 扫描 器 的 行为 吻合 。 这 相当 自然 地 导致 按 
逆 顺 序 构造 最 右派 生 的 自 底 向 上 分 析 器 。 在 构建 的 每 一 步 ， 语法 分 析 器 将 在 部 分 构建 起 来 的 分 析 树 的 上 
边界 进行 操作 ; 当前 上 边界 是 派生 中 相应 的 句 型 的 前 级 。 因 为 每 个 句 型 出 现在 最 右派 生 中 ， 所 以 还 没有 
检查 到 的 后 级 由 终结 符 组 成 。 

当 文法 非 歧义 时 ， 自 底 向 上 分 析 比 较 容易 。 对 于 非 歧 义 文法 ， 最 右派 生 是 惟一 的 。 对 于 一 大 类 非 歧 
义 文 法 ， 可 以 从 % 和 有 限 的 上 下 文 来 决定 %-;。 这 导致 一 类 高 效 的 自 底 向 上 分 析 器 。 

本 节 考 虚 称 为 LR(1) 分 析 器 的 自 底 向 上 分 析 器 的 特定 类 。 这 些 分 析 器 从 左 到 右 扫 描 输 入 ， 这 是 扫描 器 返 
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回归 类 字 的 顺序 。 这 些 语法 分 析 器 按 相反 顺序 构建 最 右派 生 。 在 分 析 过 程 的 每 一 步 ，LR(1) 分 析 器 根据 到 此 

为 止 的 分 析 历 史 和 最 多 一 个 向 前 看 字符 做 出 决定 。LR(1) 的 名 字 得 自 于 以 下 三 个 性 质 : 从 左 到 右 扫 描 (L), 
北向 最 右派 生 《〈R) 和 向 前 看 一 个 符号 (1)。 非 形式 地 ， 如 果 一 个 语言 可 以 通过 单一 的 从 左 到 右 扫 描 、 构 建 
逆向 最 右派 生 ， 并 且 只 使 用 一 个 向 前 看 符号 来 分 析 的 话 ， 那 么 我 们 称 这 一 语言 具有 LR(1) ER. © 


3.4.1 移入 归 约 分 析 


构造 有 效 的 自 顶 向 下 分 析 器 的 关键 是 发 现在 每 步 使 用 的 产生 式 的 正确 右 部 。 在 自 底 向 上 的 语法 分 析 
中 ,至 关 重 要 的 步 又 是 开发 有 效 的 寻找 沿 着 树 的 当前 上 边界 的 匹配 的 机 制 。 形 式 地 ， 语 法 分 析 器 必须 寻 
找 上 边界 的 某 个 子 串 6， 其 中 

1) 6 是 某 个 产生 式 4 一 有 的 右 部 ， 而 且 

2) 4 一 6 是 输入 流 的 最 右派 生 中 的 一 步 。 
出 于 效率 的 缘故 ， 我 们 希望 在 最 多 看 到 有 右 侧 的 下 一 个 字 时 ， 语 法 分 析 器 完成 这 一 工作 。 

我 们 可 以 把 每 个 可 能 的 匹配 表示 成 序 对 〈4 一 6，k)》 ， 其 中 4 一 6 是 G 中 的 产生 式 ， 而 k 是 树 的 当前 上 边 
界 上 6 的 右 部 的 位 置 。 如 果 使 用 4 取代 的 这 一 出 现 是 输入 字符 串 的 逆向 最 右派 生 中 的 下 一 步 ,那么 (AB, 
Kk) 称 为 自 底 向 上 分 析 器 的 一 个 身 杨 (handle)。 一 个 句柄 精确 地 表示 出 在 构建 逆向 最 右派 生 的 下 一 步 。 

自 底 向 上 分 析 器 是 通过 反复 锁定 当前 部 分 分 析 树 上 边界 上 的 句柄 ， 且 执行 这 些 句柄 所 描述 的 归 约 来 
工作 的 。 当 上 边界 不 包含 句柄 时 ， 分 析 器 调用 扫描 器 得 到 下 一 个 字 ， 构 建 相应 的 叶 结 点 ， 并 使 其 成 为 部 
分 构建 起 来 的 树 中 的 最 右 叶 子 。 这 样 ， 向 前 扩展 一 个 叶 结 点 。 

为 了 看 清 这 一 工作 过 程 ， 考 虑 使 用 图 3-1 的 经 典 表达 式 文 法 分 析 字 符 串 x-2 x y。 分 析 器 的 每 一 步 状 
态 被 概括 在 图 3-9 中 。 图 3-10 给 出 在 这 一 过 程 中 每 一 步 相应 的 部 分 分 析 树 ; 我 们 使 用 点 线 框 把 每 个 图 中 沿 
其 顶端 的 上 边界 轿 起 来 。 在 每 一 步 ， 分 析 器 或 者 寻找 上 边界 上 的 句柄 ， 或 者 把 下 一 个 字 加 到 上 边界 上 。 


下 -- 个 字 (Next Word) 边界 (Frontier) 句柄 (Handle) 动作 (Action ) 


ident 一 Done 一 extend 
ident (Factor—ident,1) reduce 
Factor (Term—Factor,1) reduce 
Term (Expr> Term,1) reduce 
Expr — none — extend 
Expr - — none — extend 
Expr - num (Factor—num,3) reduce 
Expr - Factor (Term-»+Factor,3) reduce 
Expr - Term — none 一 extend 
Expr - Term x — none — extend 
Expr - Term ident (Factor ident,5) reduce 
Expr - Term x Factor (Term Term x Factor,5) reduce 
Expr - Term {Expr— Expr - Term,3) reduce 
Expr (Goal Expr,1) reduce 
Goal — none — accept 


1 
2 
3 
4 
5 
6 
7 
8 
9 


图 3-9 自 底 向 上 分 析 器 分 析 x-2 x y 时 的 状态 


O LR 分 析 理 论 定 义 一 系列 分 析 技 术 ， 即 LR(k) 分 析 器 ， 基 中 k 是 任意 非 负 整数 。 这 里 ,x 表示 语 法 分 析 器 所 需 
的 向 前 看 符号 的 数量 。 对 于 任意 的 > 1，LR(1) 分 析 器 与 LR(K) 分 析 器 接受 相同 的 语言 集合 ; 然而 ， 语 言 的 
LR(1) 文法 可 能 比 需要 更 多 向 前 看 符号 的 文法 更 加 复杂 。 
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ident 





图 3-10 x-2 xy 在 自 底 向 上 分 析 中 的 部 分 分 析 树 


正如 例子 所 示 的 那样 ， 语 法 分 析 器 只 需 检查 已 部 分 构建 起 来 的 分 析 树 的 上 边界 。 利 用 这 一 事实 ， 我 
们 可 以 构建 称 为 移入 归 约 (shift-reduce) 分 析 器 的 自 底 向 上 分 析 器 的 一 种 非常 清晰 的 形式 。 这 样 的 语法 
分 析 器 使 用 栈 来 保存 上 边界 ; 从 而 以 两 种 方法 简化 算法 。 首 先 ， 栈 简化 保存 上 边界 的 空间 组 织 问题 。 为 
了 扩展 边界 ， 语 法 分 析 器 只 需 把 当前 输入 符号 压 人 栈 的 顶端 。 其 次 ， 这 确保 所 有 句柄 的 右 端 都 位 于 栈 顶 。 
这 样 ， 我 们 就 不 必 再 明确 地 表示 句柄 的 位 置 ， 简 化 了 表示 并 使 得 句柄 集合 有 限 。 

图 3-11 给 出 一 个 移入 归 约 分 析 器 的 例子 。 一 开始 ， 它 将 一 个 特定 的 符号 invalid 移 入 到 栈 上 ， 并 从 扫 

描 器 中 获取 第 一 个 输入 符号 。 接 着 ， 它 遵守 一 个 简单 的 规律 ， 把 输入 符号 移入 到 栈 上 ， 直到 发 现 一 个 多 
炳 ， 句 柄 一 旦 被 发 现 ， 语 法 分 析 器 就 归 约 这 个 句柄 。 当 栈 顶 包 含 Goai 且 分 析 器 消耗 了 所 有 的 输入 时 ， 

(109) 法 分 析 器 终止 这 一 过 程 。 
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push invalid 
word + NextWord() 
repeat until (word = eof & the stack contains 
exactly Goal on top of invalid) 
if a handle for A-+8 is on top of the stack then 
/* reduce by Af */ 
Pop | 8 | symbols off the stack 


push A onto the stack 

else if (word + eof) then 
/* shift word onto the stack */ 
push word. 
word + NextWord() 

else /* no handle, no input */ 
report syntax error & halt 





图 3-11 移入 归 约 分 析 算 法 


当 句 柄 发 现 机 制 失败 时 ， 这 一 算法 发 现 语法 错误 。 因 为 图 3-11 只 是 用 一 种 抽象 的 方法 描述 句柄 查询 ， 
“if a handle for A>Bis on top of the stack,” 错 误 检 查 的 细节 不 很 清晰 。 事 实 上 ， 图 3-11 表 明 ， 
只 有 当 所 有 输入 已 被 移 人 到 栈 中 时 ， 错 误 才 可 能 发 生 。 当 我 们 揭示 句柄 发 现 机 制 时 ， 我 们 将 会 看 到 语法 
分 析 器 在 这 一 过 程 的 更 早 阶段 发 现 语法 错 语 。 例 如 ， 输 入 字符 串 x+ + y 不 在 经 典 表 达 式 文法 所 描述 的 语 
言 中 。 句 柄 发 现 器 应 该 在 看 到 * 跟 在 一 个 + 后 面 时 马上 就 识别 出 这 一 错误 。 

使 用 图 3-11 中 的 算法 ， 我 们 可 以 重新 解释 图 3-9 来 展示 我 们 的 移 人 归 约 分 析 器 作用 于 输入 流 x-2 x y 
的 动作 。 标 有 “Next Word” 的 列 给 出 这 一 算法 中 的 变量 word 的 内 容 。 标 有 “Frontier” 的 列 描述 每 一 步 
上 栈 的 内 容 ; 栈 顶 向 右 。 最 后 ,动作 extend 标 明 一 个 移 和 人; reduce 表 示 一 个 归 约 。 

对 于 长 度 为 的 输入 流 ， 移 入 归 约 分 析 器 执行 3 次 移 人 。 它 对 于 派生 的 每 步 执 行 一 个 归 约 ， 共 有 r 步 。 
repeat unti7 循 环 的 每 次 迭代 寻找 一 个 句柄 ， 所 以 它 必须 执行 s + r 次 句柄 发 现 操作 。 这 等 价 于 分 析 树 上 
结 点 的 数目 ; 每 次 移入 和 每 次 归 约 都 在 分 析 树 上 创建 一 个 新 结 点 。 

对 于 固定 的 文法 ，r 必 须 是 0(*)， 所 以 句柄 发 现 操 作 的 数目 与 输入 字符 串 的 长 度 成 正比 。 如 果 我 们 能 
够 维持 句柄 发 现 的 代价 为 一 个 小 常量 ， 那 么 语法 分 析 器 的 操作 时 间 与 + r 成 正比 。 当 然 ， 这 样 的 句柄 发 
现代 价 的 约束 使 我 们 无 法 在 每 次 句柄 发 现 操作 中 使 用 遍历 整个 栈 的 任何 技术 。 而 这 对 高 效 的 句柄 发 现 非 
常 重要 。 


3.4.2 RRA 


句柄 发 现 机 制 是 高 效 自 底 向 上 分 析 的 关键 。 当 它 处 理 输入 字符 串 时 ， 语 法 分 析 器 必须 发 现 并 跟踪 所 
有 可 能 的 句柄 。 例 如 ， 每 个 合法 输入 最 终 把 整个 上 边界 归 约 成 文法 的 目标 符号 。 在 经 典 表达 式 文 法 中 ， 
Goal~>Expr 是 归 约 到 Goal 的 惟一 产生 式 。 它 必须 是 任意 成 功 的 语言 分 析 中 的 最 后 归 约 。 如 果 整 个 上 边界 
被 归 约 到 Goal， 那 么 句柄 的 位 置 必 须 是 1。 因 此 ，(Goal->Expr，1〉 是 每 次 语法 分 析 开 始 处 的 可 能 句柄 。 
当 语 法 分 析 器 建立 一 个 派生 时 ， 它 发 现 其 他 句柄 。 在 每 一 步 ， 可 能 的 句柄 集合 应 该 表示 导致 归 约 的 
不 同 后 绥 ， 前 提 是 能 够 看 到 这 样 的 句柄 。 给 定 已 构建 的 派生 部 分 ， 每 个 可 能 的 句柄 表示 某 个 文法 符号 的 


串 ， 这 一 文法 符号 串 是 文法 中 某 个 产生 式 的 完整 右 部 。 图 3-9 给 出 移入 归 约 分 析 器 在 处 理 x-2 x y 时 发 现 


的 9 个 完整 句柄 。 

在 上 述 分 析 中 的 第 三 步 和 第 八 步 的 句柄 都 是 由 Term 一 Facror 描 述 的 归 约 。 句 柄 有 不 同位 置 域 ， 表 明 
上 边界 中 符号 Factor 出 现 的 地 方 。 然 而 ， 在 移入 归 约 分 析 器 中 ， 表 中 所 给 出 的 上 边界 的 位 置 总 是 处 于 栈 
中 ， 而 且 最 新 标识 符 在 栈 顶 。 在 第 三 步 和 第 八 步 ， 句 柄 的 位 置 域 描述 栈 项 的 符号 。 事 实 上 ， 对 于 语法 分 
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析 器 识别 的 每 个 句柄 ， 位 置 域 都 描述 栈 的 顶端 。 如 果 我 们 将 这 一 位 置 域 看 成 栈 顶 的 相关 位 置 ， 那 么 我 们 
就 能 够 显著 减少 不 同 句柄 的 数量 : 直至 文法 中 每 一 个 产生 式 有 一 个 句柄 。 
继续 推进 这 一 表 记 法 ， 我 们 可 以 表示 移入 归 约 分 析 器 应 该 跟踪 的 可 能 句柄 。 如 果 我 们 使 用 占 位 符 * 
来 表示 栈 顶 ， 那 么 图 3-9 中 的 九 个 句柄 变 成 : 
(Factor-+ident e) (Term— Factor e) (Expr— Term e) 
(Factor—nun e) (Term— Factor e) (Factor ident e) 
(Term-+Term x Factore) (Expr-+Expr - Terme) (Goal Expr e) 


上 面 的 表 记 法 表 明 第 二 个 和 第 五 个 句柄 是 相同 的 ， 第 一 和 第 六 个 也 是 相同 的 。 这 一 表 记 法 还 生成 将 来 发 
现 名 柄 的 可 能 性 的 一 种 方法 。 

考虑 步骤 六 处 的 分 析 器 状态 ， 此 时 ,输入 符号 为 hum 和 上 边界 为 Expr-。 根 据 表格 ， 我 们 知道 下 一 个 
归 约 将 是 《Factor>num* )， 后 面 跟着 下 一 个 移入 和 归 约 以 标识 符 x 和 ident。 然 而 ， 当 前 的 上 边界 是 什 
么 呢 ? 分 析 器 已 识别 出 Expr-。 分 析 器 在 它 能 够 归 约 上 边界 的 这 一 部 分 之 前 ， 它 需要 识别 一 个 Term。 使 
用 这 一 栈 相 关 的 表 记 法 ， 我 们 可 以 把 语法 分 析 器 的 状态 表示 为 Expr 一 Expr-。Term。 语 法 分 析 器 已 经 识别 
出 一 个 Expr 和 一 个 -， 并 且 - 在 栈 顶 。 如 果 语 法 分 析 器 达到 一 个 将 一 个 Term 移 人 到 Expr~ 的 上 端的 状态 ， 
那么 它 将 完成 句柄 Expr 一 Expr-Term。。 

使 用 同时 表示 名 柄 和 可 能 句柄 的 一 个 具体 的 表 记 法 ， 我 们 可 以 问 这 样 的 问题 : 语法 分 析 器 必须 识别 
多 少 个 可 能 句柄 ?每 个 产生 式 的 右 部 在 它 的 开始 处 、 在 它 的 结束 处 以 及 在 任意 两 个 相连 的 符号 之 间 都 可 
以 有 一 个 占 位 符 。 如 果 右 部 有 * 个 符号 ， 它 就 有 k + 1 个 占 位 符 位 置 。 文 法 的 可 能 句柄 的 数目 是 所 有 产生 
式 的 右 部 的 长 度 和 。 完 整 句柄 的 数目 是 产生 式 的 数目 。 这 两 个 事实 导致 LR(1) 分 析 器 背后 的 一 个 重要 结 


. 果 。 


一 个 文法 生成 语法 分 析 器 必须 识别 的 向 柄 〔【 和 可 能 多 柄 ) 的 有 穷 集 合 。 


根据 第 2 章 ， 我 们 有 识别 字 的 有 穷 集合 的 合适 工具 DFA。LR(1) 分 析 器 使 用 句柄 识别 DFA 来 有 效 地 
发 现 处 于 分 析 栈 栈 顶 的 句柄 。 表 格 构 造 算法 构建 这 样 一 个 DFA 模 型 ， 并 用 表格 序 对 来 实现 它 。 

仔细 检查 图 3-9 中 的 分 析 揭 示 出 这 一 推理 中 的 一 个 缺点 。 考 虑 第 九 步 处 的 语法 分 析 器 动作 。 上 边界 
是 Expr-Term， 表 明 甸 柄 是 《Expr 一 Expr-Term*)。 然 而 ， 语 法 分 析 器 决定 通过 把 x 移入 到 栈 中 来 扩展 这 
一 边界 ， 而 不 是 把 这 一 边界 归 约 到 Expr。 显 然 ， 对 语法 分 析 器 来 说 这 是 正确 的 动作 。 没 有 包含 后 面 跟 有 
x 的 Expr 的 可 能 句柄 。 

为 了 决定 正确 的 动作 ， 语 法 分 析 器 能 够 识别 不 同 的 右上 下 文 ， 也 就 是 输入 流 中 在 后 面 出 现 的 符号 所 
需要 的 不 同 动作 。 在 第 九 步 ， 可 能 的 句柄 集合 是 : 


(Expr—Expr - Term e) (Term— Term e x Factor) (Term-»Term e + Factor) 


下 一 个 输入 符号 x 显然 与 第 二 个 选择 匹配 ， 而 且 剔 除 第 三 个 选择 。 语 法 分 析 器 需要 一 个 在 第 一 个 和 第 二 
个 选择 之 间 做 出 选择 的 标准 。 这 需要 比 上 边界 所 拥有 的 上 下 文 更 多 的 上 下 文 。 

为 了 在 将 Expr-Term 归 约 到 Expr 还 是 移 人 * 以 识别 Term x Factor 之 间 做 出 选择 ， 语 法 分 析 器 必须 知 
道 在 有 效 分 析 中 哪个 符号 可 以 出 现在 Expr 和 Term 的 右边 。 考 虚 我 们 的 文法 ， 在 产生 式 1 和 2 中 ，+ 和 -直接 
跟 在 Expr 的 后 面 。 根 据 产生 式 4 和 5，x 和 + 可 以 跟 在 Term 的 后 面 。 因 此 ， 在 步骤 九 ， 语 法 分 析 器 可 以 通 
过 查看 下 一 个 符号 来 选择 正确 的 动作 : 对 于 + 和 -， 语 法 分 析 器 应 该 进行 归 约 ; 对 于 x 和 + ， 它 应 该 移 人 。 
因为 下 一 个 符号 是 x ， 所 以 语法 分 析 器 应 该 移入 。 

LR(1) 分 析 器 可 以 精确 识别 那些 一 个 向 前 看 符号 就 足以 决定 是 移入 还 是 归 约 的 语言 。LR(1) 构造 算 
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法 构建 一 个 句柄 识别 DFA; 分 析 算 法 使 用 这 一 DFA 来 识别 分 析 栈 中 的 句柄 和 可 能 句柄 。 它 使 用 移 人 归 约 
分 析 框 架 来 引导 DFA 的 运用 。 这 一 框架 可 以 递归 地 调用 DFA; 为 了 完成 这 一 调用 ， 在 栈 中 储存 表示 分 析 |114 
树 上 边界 的 文法 符号 的 同时 ， 还 储存 有 关 DFA 内 部 状态 的 信息 。 


3.4.3 LR(1) 分 析 器 


LR(1) 分 析 器 , 包括 它 的 称 为 SLR(1) 和 LALR(1) 的 限定 形式 , 是 得 到 最 广泛 应 用 的 语法 分 析 器 系列 。 
表 驱 动 LR(1) 分 析 器 具有 很 高 的 效率 。 存 在 很 多 自动 构建 表格 的 工具 。 这 些 工 具 接 受 的 文法 使 我 们 能 够 
自然 地 表示 大 多 数 程序 设计 语言 的 结构 。 本 节 阐 述 LR(1) 分 析 器 的 工作 方式 ， 并 展示 如 何 构 造 一 种 称 为 
规范 LR(1) 分 析 器 的 LR(1) 分 析 器 的 分 析 表 格 。 
图 3-12 给 出 典型 的 LR(1) 分 析 器 生成 器 系统 的 结构 。 编 译 器 设计 者 创建 描述 源 程 序 语言 的 文法 。 分 
析 器 生成 器 读 取 这 一 文法 并 生成 一 对 驱动 LR(1) 分 析 器 的 表格 。 这 些 表 格 描绘 分 析 所 需要 的 所 有 文法 信 
息 ; 在 某 种 意义 上 ,分 析 器 生成 器 把 识别 句柄 、 决 定 移入 时 机 、 决 定 归 约 时 机 以 及 在 归 约 中 使 用 哪个 规 
则 所 需 的 所 有 信息 预 编译 到 这 些 表 格 中 。 在 大 多 数 这 样 的 系统 中 ， 编 译 器 设计 者 也 可 以 为 将 执行 归 约 的 
产生 式 提供 代码 片段 。 这 些 特定 “动作 ”提供 一 种 在 编译 时 执行 语法 制导 计算 的 机 制 。 第 4 章 给 出 这 些 
特定 动作 的 某 些 运用 。 





图 3-12 LR(1) 分 析 器 生成 器 系统 的 结构 


LR(1) 表格 的 构造 法 是 理论 应 用 于 实践 的 一 个 出 色 的 实例 。 这 一 构造 法 系统 地 构建 句柄 识别 DFA 的 
模型 ， 然 后 把 这 一 模型 翻译 成 表 驱 动 框架 分 析 器 的 一 对 表格 。 然 而 ， 这 一 构造 法 是 一 个 复杂 的 任务 ， 需 
要 格外 注意 细节 。 这 正 是 应 该 自动 化 的 任务 : 分 析 器 生成 器 在 跟踪 这 些 繁杂 计算 上 要 比 人 类 更 优秀 。 尽 
管 如 此 ， 技 术 娴 熟 的 编译 器 设计 者 应 该 理解 这 一 表格 构造 算法 ， 因 为 他 们 可 以 提供 语法 分 析 器 的 工作 方 
式 ， 分 析 器 生成 器 所 能 遇 到 的 错误 ， 这 些 错 误 是 如 何 引 发 的 ， 以 及 如 何 修正 它们 。 

如 图 3-12 所 示 ，LR(1) 分 析 器 由 一 个 表 驱 动 器 和 驱动 分 析 器 的 一 对 表格 组 成 。 图 3-13 给 出 表 驱 动 器 。 
称 为 4ction 和 6oto 的 一 对 表格 描绘 驱动 器 所 需 的 文法 信息 。 图 3-14 和 图 3-15 给 出 经 典 表达 式 文法 的 相应 
表格 。 为 了 简化 表格 构造 算法 ， 我 们 为 文法 添加 了 一 个 目标 产生 式 并 对 其 余 产 生 式 适 当 编 号 。 结 果 文 法 
如 下 : 
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Goal — Expr 

Expr -—+ Expr + Term 
| Expr - Term 
| Term 

Term — Term x Factor 
| Term + Factor 
| Factor 

Factor — ( Expr ) 
| num 
| ident 





push invalid 
push start state, so 
word + NextWordQ) 
while (true) 
s + top of stack 
if Action[s,word] = “shift s;” then 
push word 
push si 
word + NextWord() 
else if Action[s,word] = “reduce A > 3” then 
pop 2 x | B | symbols 
s + top of stack 
pushA 
push Goto|s, A] 
else if Action[s, word] = “accept” then 
return 
else report syntax error and halt 


图 3-13 LR(1) 分 析 器 的 驱动 器 


Act ion# 


Fa 
o 


x + 


OSNON AUN me O 


图 3-14 经 典 表 达 式 文法 的 4ction 表 
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图 3-14 (4) 


60to 表 Goto 表 
状态 Expr Term 状态 Expr Term Factor 
1 2 ”16 
17 
18 
19 
20 


(= 


Coon On ff WH 





图 3-15 经 典 表 达 式 文法 的 6oto 表 


框架 分 析 器 类 似 于 图 3-11 所 给 的 移 和 人 归 约 分 析 器 。 在 每 一 步 ， 框 架 分 析 器 把 两 个 对 象 压 人 栈 : KA 
于 上 边界 的 一 个 文法 符号 和 来 自 于 句柄 识别 器 的 一 个 状态 。 它 有 下 面 4 种 动作 : 

(1) BA (shift) 

通过 将 向 前 看 符号 移入 栈 中 来 扩展 上 边界 ， 同 时 将 句柄 识别 器 的 新 状态 压 人 栈 中 。 这 可 能 导致 识别 
器 的 递归 调用 。 i 
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(2) 归 约 (reduce) 

通过 使 用 当前 句柄 的 左 部 取代 这 一 句柄 缩短 上 边界 。 通 过 对 每 个 句柄 右 部 符号 弹出 两 个 栈 中 元 素 ， 
丢弃 所 有 用 于 识别 这 一 句柄 的 中 间 状 态 。 下 一 步 ， 它 使 用 句柄 下 面 的 状态 和 句柄 的 左 部 寻找 新 的 识别 器 
状态 ， 并 把 句柄 的 左 部 和 新 状态 压 入 栈 中 。 

(3) 接受 (accept) 

报告 成 功 。 只 有 当 分 析 器 将 上 边界 归 约 到 目标 符号 且 向 前 看 符号 是 eof 时 ， 才 能 达到 这 一 状态 。 

(4) 错误 (error) 

报告 语法 错误 。 在 4ctfon 表 格 包 含 移 人 (shift), YAR) (reduce) 和 接受 (accept) 之 外 的 条 目 时 达 
到 这 一 状态 。 在 图 中 ， 这 些 条 目 是 空 的 。 

在 4ction 表 中 ， 字 母 * 表 示 移 人 ，r 表 示 归 约 。 因 此 ， 条 目 s3 表 示 “ 移 人 并 进入 状态 s,” 的 动作 ， 而 
r5 表 示 “ 用 产生 式 5 进 行 归 约 。”6oto 表 描绘 在 归 约 动作 后 必须 采取 的 转换 。 这 一 表格 的 稀疏 性 反应 只 有 
较 少 的 状态 表示 归 约 的 事实 。 

为 了 理解 这 一 分 析 器 ， 再 次 考虑 我 们 的 例子 。 图 3-16 给 出 LR(1) 分 析 器 分 析 表 达 式 x-2 x y 时 的 状态 
序列 。 分 析 器 以 移 人 jnva17d 并 将 以 0 表示 的 状态 压 人 栈 中 开始 。 下 一 步 ， 分 析 器 把 ident 移 人 到 栈 中 ， 
接着 将 其 归 约 到 Factor、7erm 和 Expr。 接 着 ， 它 移 人 -， 再 移 人 num。 此 时 ， 它 将 num 归 约 到 Factor， 接 
着 将 Factor 归 约 到 Term。 下 一 步 ， 它 移入 x ， 然 后 移 人 ident 。 最 后 ， 它 将 ident 归 约 到 Factor， 将 Term 
x Factor 归 约 到 Term。 然 后 ， 将 Expr-Term 归 约 到 Expr。 此 时 ， 因 为 栈 顶 为 Expr 而 下 一 个 字 为 EOF, & 
接受 这 一 输入 字符 串 。 这 与 图 3-9 所 描述 的 序列 类 似 。 ' 


当前 符号 (Current Symbol ) - $k (Stack) 动作 (Action) 


ident 


invalid 0 

invalid 0 ident 6 
invalid 0 Factor 3 
invalid 0 Term 2 

invalid 0 Expr 1 

invalid 0 Expr 1 - 8 
invalid 0 Expr 1 - 8 num 5 


shift 
reduce 10 
reduce 7 
reduce 4 
shift 
shift 
reduce 9 





invalid 0 Expr 1 -~ 8 Factor 3 reduce 7 
invalid 0 Expr 1 - 8 Term 18 shift 
invalid 0 Expr 1 - 8 Term 18 x 9 shift 
invalid 0 Expr 1 - 8 Term 18 x 9 ident 6 reduce 10 
invalid 0 Expr 1 - 8 Term 18 x 9 Factor 19 | reduce 5 
invalid 0 Expr 1 - 8 Term 18 reduce 3 
invalid 0 Expr 1 accept 


1 
2 
3 
4 
5 
6 
7 
8 
9 


图 3-16 LR(1) 分 析 器 分 析 x-2 x y 时 的 状态 


构建 LR(1) 分 析 器 的 关键 是 构建 4ction 表 和 6oto 表 。 这 些 表 格 描绘 句柄 识别 器 DFA 的 动作 ， 同 时 还 
描绘 使 用 限定 的 右上 下 文 决定 是 移入 、 归 约 还 是 接受 等 所 需 的 信息 。 虽 然 可 以 通过 手工 构建 这 些 表格 ， 


但 是 算法 需要 处 理 大 量 的 细节 和 细心 的 记录 。 构 建 LR(1) 表格 是 应 该 交 给 计算 机 进行 自动 化 的 一 个 最 典 


型 的 例子 。 


3.5 构建 LR(1) 表格 
为 了 构建 Action 表 和 60to 表 ，LR(1) 分 析 器 生成 器 构建 句柄 识别 DFA 的 模型 ， 并 使 用 这 一 模型 填充 
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这 些 表格 。 这 一 模型 使 用 一 组 将 在 下 一 小 节 描 述 的 LR(1) 项 目 来 表示 语法 分 析 器 的 状态 ; 使 用 系统 技术 
构造 这 些 项 目 集 合 。 这 一 模型 称 为 LR(1) 项 目 集合 的 规范 集合 (canonical collection of sets of LR(1) 
items )， 记 作 CC={CCo，CC!，CC，,，…，CC,}。CC 中 的 每 个 集合 代表 最 终 分 析 器 的 一 个 状态 。 

我 们 使 用 两 个 例子 来 解释 这 一 构造 法 。 第 一 个 例子 是 我 们 的 SheepNoise 文 法 SN， 并 添加 了 一 个 目标 
符号 。 它 足够 小 以 至 于 可 用 作 详 细 说 明 这 一 过 程 各 个 步骤 的 例子 。 


© Goal >  SheepNoise 
SheepNoise — baa SheepNoise 
| baa 





在 构建 这 些 表格 中 ， 我 们 将 显 式 地 把 符号 eof 作 为 一 个 终结 符 。 它 出 现 于 输入 流 的 末端 。 在 文法 中 ， 它 
隐 式 地 出 现 于 目标 产生 式 的 末端 。 

第 二 个 例子 就 是 3.5.4 节 中 的 例子 ， 这 一 例子 是 典型 if-then-e1se 歧 义 文法 的 抽象 版 本 。 这 个 例子 
比 SN 更 复杂 。 因 为 这 一 文法 是 歧义 的 ， 表 格 构造 法 会 失败 。 然 而 ， 失 败 出 现 于 这 一 过 程 的 后 期 ， 所 以 这 
一 例子 展示 这 一 构造 法 的 更 加 复杂 的 部 分 。 它 强调 了 导致 错误 的 情况 。 


3.5.1 LR(1) ME 


LR(1) 表格 构造 法 需要 句柄 、 可 能 句柄 以 及 与 其 相关 的 向 前 看 符号 的 具体 表示 。 我 们 称 这 样 的 表示 
为 LR(1) 项 目 。 一 个 LR(1) 项 目 是 一 个 序 对 [4 一 B.y，al]， 其 中 4 一 B。y 代 表 句 柄 或 可 能 句柄 ， 占 位 符 。 表 
示 栈 顶 的 位 置 ，aE7 是 源 语 言 的 字 。 各 个 LR(1) 项 目 描述 自 底 向 上 语法 分 析 器 的 格局 ; 它们 表示 与 语法 
分 析 器 已 检查 的 左上 下 文 一 致 的 可 能 句柄 。 

对 于 一 个 产生 式 4 一 5 y 和 向 前 看 符号 aET， 占 位 符 可 以 生成 三 种 不 同 的 项 ， 每 一 种 都 有 其 自身 的 含 
义 。 对 于 每 一 种 情况 ， 项 目 出 现在 与 某 个 语法 分 析 器 状态 相关 的 集合 的 事实 表明 ， 语 法 分 析 器 已 检查 过 
的 输入 与 文法 中 一 个 4 后 面 跟 一 个 a 的 出 现 是 一 致 的 。 项 目 中 占 位 符 。 的 位 置 提供 更 多 的 信息 。 

*[A>*B y，a] 表 示 一 个 4 也 许 是 合法 的 ， 且 在 这 一 点 识别 一 个 B 将 向 发 现 4 的 方向 上 迈进 一 步 。 我 们 

称 这 样 的 项 目 为 可 能 的 (possibility)， 因 为 它 表示 对 于 已 检查 输入 的 一 个 可 能 完成 的 项 目 。 

° [4 一 B.y，al] 表 示 语 法 分 析 器 已 经 通过 识别 B， 从 4 也 许 是 合法 的 状态 向 前 迈进 了 一 步 。p 与 识别 4 
一 致 。 下 一 步 将 要 识别 一 个 y。 我 们 称 这 样 的 项 目 为 部 分 完整 的 (partially complete ) 。 

* [4 一 8 y。，a] 表 示 语 法 分 析 器 已 经 在 后 面 跟 一 个 a 的 A 也 许 是 合法 的 前 提 下 发 现 了 Bb y。 如 果 向 前 看 
符号 是 a， 那 么 语法 分 析 器 就 可 以 将 B y 归 约 到 4， 而 且 这 个 项 目 是 句柄 。 这 样 的 项 是 完整 的 
(complete ) 。 

在 LR(1) 项 目 中 ， 占 位 符 * 描 绘 左 上 下 文 ， 也 就 是 迄今 为 止 的 分 析 历史 。 向 前 看 符号 描绘 可 能 的 右 

上 下 文 。 如 果 语 法 分 析 器 把 占 位 符 移动 到 产生 式 的 末端 并 发 现下 一 个 符号 与 项 目的 向 前 看 符号 匹配 ， 那 
么 语法 分 析 器 将 使 用 该 项 目的 产生 式 进行 归 约 。 
SheepNoise 文 法 生成 下 列 LR(1) 项 目 : 


[Goal — e SheepNoise,eof] [SheepNoise — e baa SheepNoise, eof] 
[Goal— SheepNoisee,eof] [SheepNoise — baa e SheepNoise, eof | 
[SheepNoise > e baa, eof] [SheepNoise 一 baa SheepNoise e, eof} 
[SheepNoise — baa e, eof] [SheepNoise — e baa SheepNoise, baa] 
[SheepNoise — e baa, baa] [SheepNoise 一 baae SheepNoise, baa] 
[SheepNoise — baa e, baa] [SheepNoise 一 baa SheepNoise e, baa] 
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M B [Goal--SheepNoises, eof] 表 示 这 样 一 个 格局 : WE E CARa AA Goat — AFAR, it 
且 已 经 消耗 尽 输 入 ， 这 由 向 前 看 符号 eof 表 示 。 如 果 栈 中 Goal 的 下 面 是 空 的 (也 就 是 说 ， 符 号 invalid 在 
Goal 的 下 面 )， 那 么 分 析 成 功 。 


3.5.2 构造 规范 集合 


CC 的 构造 法 以 构建 语法 分 析 器 的 初始 状态 的 一 个 模型 开始 。 这 一 状态 由 代表 语法 分 析 器 的 初始 状 
态 的 项 目 集合 组 成 ， 包 括 在 初始 状态 必须 成 立 的 所 有 项 目 。 为 了 简化 构建 这 样 的 初始 状态 的 任务 ， 构 造 
法 要 求 文法 有 惟一 的 目标 符号 ， 就 像 SN 那 样 。 

项 目 [Goal 一 。SheepNoise,， eo 有 ] 描 述 语 法 分 析 器 的 初始 状态 。 它 表示 这 样 一 个 格局 : 表明 后 面 跟 着 
eof 的 SheepNoise 应 该 是 一 个 合法 的 分 析 。 这 个 项 目 是 CC 中 记 作 CCo 的 第 一 个 状态 的 种 子 。 如 果 对 于 目 
标 符 号 文法 有 几 个 不 同 的 产生 式 ， 那 么 它们 中 的 每 个 都 生成 CCo 的 初始 种 子 中 的 一 个 项 目 。 

1. 过 程 c70sure . 

为 了 计算 分 析 器 的 初始 状态 CCo， 构 造 法 从 目标 符号 的 每 个 可 选 右 部 的 初始 项 目 开 始 。 为 了 完成 这 
一 状态 ， 构 造 法 必须 把 所 有 由 这 些 初 始 项 目 曹 涵 的 项 目 加 进来 。 过 程 闭 包 〈c1osure) 完成 这 一 工作 。 


closure(s) 
while (s is still changing) 
for each item [A+ è Cé,a] € s 
for each production Coy € P 
for each b € First(da) 
ses U {[C-e,b]} 
return s 


过 程 cJosure 对 集合 * 中 的 每 个 项 目 进行 选 代 。 如 果 一 个 项 目 中 的 占 位 符 * 的 后 面 紧 跟 某 个 非 终结 符 
C， 那 么 对 于 每 个 左 部 为 C 的 产生 式 ，c1osure 必 须 把 一 个 或 多 个 相应 的 项 目 加 进来 。 占 位 符 * 出 现 于 这 
些 产生 式 右 部 的 开始 处 。 

这 样 做 的 原理 是 显然 的 。 如 果 [4 一 BeC ô, a]Es， 那 么 左上 下 文 的 一 个 可 能 完整 化 是 要 找 归 约 到 C， 
且 后 面 跟着 6a 的 一 个 字符 串 。 这 个 完整 化 将 引发 一 个 到 4 的 归 约 ， 因 为 它 填 充 这 一 产生 式 的 右 部 (Cô) 
并 且 跟 着 一 个 有 效 的 向 前 看 符号 。 

对 于 产生 式 C 一 7”，c1osure 过 程 在 /之 前 插入 一 个 占 位 符 ， 并 把 适当 的 向 前 看 符号 ， 也 就 是 作为 初始 
符号 出 现 于 6a 中 的 所 有 终结 符 加 进来 。 这 包括 FIRST(6) 中 的 每 一 个 终结 符 。 如 果 sEFIRST(6)， 它 还 包 
含 a。 在 这 一 算法 中 ， 表 记 法 FIRST(6a) 用 这 种 方法 表示 把 FIRST 集 合 扩展 到 字符 串 。 如 果 6 是 s， 这 一 集 
合 退化 成 FIRST(a) = {a}. 

对 于 SV， 初 始 项 目 是 {Goal 一 "SheepNoise, eof}。 取 它 的 闭 包 将 两 个 项 目 加 到 该 集合 : 从 产生 式 2 而 
来 的 {SheepNoise 一 。baaSheepNoise, eof} 和 从 产生 式 3 而 来 的 {SjeepNoise 一 *baa, eof}. 因为 每 一 个 项 
目的 占 位 符 。 之 后 是 终结 符 baa， 所 以 它们 不 再 生成 新 项 目 。 这 三 个 项 目 形 成 第 一 个 集合 CCo。 

HE (Closure) 计算 是 另 一 个 不 动 点 计算 。 在 每 点 ， 三 重 嵌 套 的 循环 或 者 把 项 目 加 到 * 上 ， 或 者 保 
持 s 不 变 。 它 不 从 s 中 移 去 项 目 。 因 为 集合 LR(1) 的 项 目 是 有 穷 的 ， 这 一 循环 一 定 终止 。 三 重典 套 循环 看 
似 代价 很 大 。 然 而 ， 仔 细 审 查 表明 s 中 的 每 一 项 目 只 被 处 理 一 次 。 外 部 循环 需要 考虑 那些 在 上 次 外 部 循 
环 的 选 代 中 加 入 的 各 项 目 。 中 间 循 环 只 选 代 单一 非 终 结 符 的 可 选 右 部 的 集合 ， 而 内 部 循环 在 FIRST(6a) 


上 选 代 。 如 果 6 是 es， 那么 内 部 循环 只 检查 一 个 符号 a。 因 此 ， 闭 包 计算 实际 上 更 快 。 


2. goto 过 程 
这 一 构造 法 的 第 二 个 关键 步骤 是 从 CCo 得 到 语法 分 析 器 的 其 他 状态 。 为 了 完成 这 一 工作 ， 对 于 每 个 
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状态 CC; 和 每 个 文法 符号 x， 我 们 计算 当 语法 分 析 器 在 状态 CC 识别 出 x* 时 产生 的 状态 。 过 程 goto 完 成 这 一 
工作 。 | 


goto(s, x) 
moved + @ 
for each itemi € s 
if the form of i is [a+ e xô, a] then 
moved + moved U {[a—px e 6, a]} 
return closure(moved) 


过 程 goto 有 两 个 参数 ， 一 个 是 LR(1) 的 项 目 集 s5， 另 一 个 是 文法 符号 x。 它 在 s 的 项 目 上 进行 迭代 。 如 果 它 
发 现 一 个 项 目的 占 位 符 。 紧 跟 在 x 的 前 面 ， 那 么 它 通过 把 .向 右 移动 到 x 的 后 面 而 生成 一 个 新 项 目 。 这 个 新 
项 目 表示 识别 x 而 得 到 的 状态 。 过 程 goto 把 这 些 项 目 存 放 在 集合 moved 中 ， 并 返回 closure(moved)。 

给 定 SN 的 集合 CC。， 我 们 可 以 通过 计算 goto(CC。，baa) 得 到 在 分 析 一 个 初始 终结 符 baa 之 后 的 语法 
分 析 器 的 状态 。 移 动 占 位 符 。 到 baa 的 后 面 产 生 两 个 项 目 : 从 CCo 的 项 目 2 而 来 的 [SheepNoise 一 baa。 
SheepNoise ，eoPj 和 从 CCo 的 项 目 3 而 来 的 [SheepNoise 一 baa*，eof]。 把 c1osure 运 用 到 这 一 集合 加 进来 
两 个 新 项 目 : [SheepNoise 一 *baaShneepNoise，eof] 和 [SheepNoise 一 *baa，eof]j。 这 两 个 项 目 都 得 自 于 
使 占 位 符 位 于 SheepNoise 之 前 的 第 一 个 项 目 。 

我 们 的 构造 法 使 用 goto 去 寻找 直接 来 自 于 诸如 CCo 等 状态 的 状态 集合 。 为 了 做 到 这 一 点 ， 它 对 于 出 
现 于 状态 CCo 的 项 目 中 的 占 位 符 * 后 面 的 每 一 个 文法 符号 x 计算 goto(CC。，X)。 这 产生 距 CCo 一 个 符号 的 所 
有 集合 。 为 了 计算 完整 的 规范 集合 ， 我 们 只 需要 进 代 这 一 过 程 到 一 个 不 动 点 。 

3. 构造 算法 

为 了 构造 LR(1) 项 目 集合 的 规范 集合 ， 算 法 计算 初始 状态 CCo， 然 后 系统 地 寻找 从 CCo 可 以 达到 的 
LR(1) 项 目的 所 有 集合 。 它 反复 把 goto 运 用 于 CC 中 的 新 集合 ;goto 使 用 cl1osure。 如 果 目 标 产生 式 是 
S's， 那 么 这 一 结构 是 : 

CCo + closure({[S’-+S, eof]}) 

CC 全 {cco} 


while (new sets are still being added to CC) 


for each unmarked set cc; € CC 
mark CC; as processed 


for each x following a e in an item in cy 
temp + goto(ccj, x) 
if temp € CC 
then CC +- CC u {temp} 


record transition from Cc; to temp on x 


如 前 所 述 ， 初 始 化 CC 为 含有 CCo 的 集合 。 然 后 ， 它 通过 寻找 从 CC 中 的 状态 到 CC 外 面 的 状态 的 转换 系统 
地 扩展 CC。 它 构造 性 地 完成 这 一 工作 ， 通 过 构建 每 个 可 能 的 状态 temp， 并 测试 temp 是 否 是 CC 的 成 员 。 
如 果 temp 是 一 个 新 成 员 ， 它 就 把 temp 加 入 到 CC 中 。 无 论 temp 是 否 是 新 成 员 ， 它 都 记录 从 CC 到 temp 的 转 
换 以 便 为 后 来 构建 goto 表 使 用 。 

为 了 保证 算法 对 每 个 集合 CC; 只 处 理 一 次 ， 算 法 使 用 一 个 简单 的 标记 方案 。 它 在 无 标记 条 件 下 生成 
每 一 个 集合 ， 而 在 处 理 这 一 集合 时 ， 对 其 做 标记 。 这 可 以 显著 减少 调用 goto 和 c7osure 的 次 数 。 

像 这 一 构造 法 中 其 他 计算 一 样 ， 这 一 计算 也 是 一 个 不 动 点 计算 。 规 范 集 合 CC 是 LR(1) WEWER 
2mevs 的 一 个 子 集 。wh7Je 循 环 是 单调 的 ; 它 只 把 新 集合 加 入 到 CC 中 。 因 为 CC 不 可 能 超过 2rzsws， 因 此 这 
一 计算 一 定 终止 。 
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4. SN 的 规范 集合 
扩充 的 SheepNoise 文 法 的 规范 集合 的 计算 过 程 如 下 所 示 : 
Ficlosure([Goal—«SheepNoise, eof]) 计算 CC。， 


Co = [Goal 一 e SheepNoise,eof], [SheepNoise 一 e baa SheepNoise, eof], 
本 [SheepNoise 一 e baa, eof] 


因为 每 个 项 目的 右 部 开头 都 有 。，CCo 只 包含 可 能 的 状态 。 这 是 合适 的 ， 因 为 CCo 是 分 析 器 的 初始 状态 。 
whi7e 循 环 的 第 一 次 迭代 产生 两 个 集合 CC, 和 CC，。 
goto(CC,, SheepNoise) #:CC,. 
CC; ={ [Goal + SheepNoise e, eof] } 


如 果 向 前 看 符号 是 eof， 那 么 项 目 [Goai 一 SheepNoise*。，eof] 是 一 个 句柄 ， 而 且 分 析 器 应 该 接受 这 一 输 
AFRE. 
goto(CC,, baa) 是 CC,。 


ccs = { [SheepNoise + e baa SheepNoise,eof], (SheepNoise + e baa, eof), 
[SheepNoise — baa e SheepNoise,eof], [SheepNoise 一 baa e, eof] 
wp771e 循 环 的 第 二 次 和 迭代 试图 从 CC 和 CC: 中 得 到 新 集合 。 对 于 任意 文法 符号 zx，goto(CC， 杂 生成 空 
集 。 对 于 x= eoffilx=Goal, goto(CC,, x) 生成 空 集 。 对 于 x*= SheepNoise， 它 生成 一 个 新 集合 CCi。 
goto(CC,, SheepNoise) 是 CC 。 


CCa = { [SheepNoise 一 baa SheepNoise e, eof] } 


BUR, goto(CC,, baa) 是 CC,， 而 CCs 已 在 CC 中 。 因 为 第 三 次 迭代 没有 把 新 集合 加 入 到 CC 中 ， 所 以 上 述 
过 程 终止 。 | 

图 3-17 给 出 规范 集合 构造 法 的 过 程 。 第 一 列表 示 和 迭代 的 序号 。 构 造 法 计算 CCo 并 使 用 goto 构 建 CC 的 
其 他 集合 。 第 一 次 选 代 对 SheepNoise 构 建 CC,， 对 baa 构 建 CC;。 第 二 次 选 代 没 有 从 CC, 得 到 任何 集合 。 
从 CC 开始 ， 它 对 SheepNoise 构 建 CC;， 对 baa 构 建 CC:。 第 三 次 迭代 没有 从 CC3 得 到 任何 集合 。 


baa eof 





图 3-17 SheepNoise 文 法 上 的 LR(1) 构造 的 轨迹 


规范 集合 代表 句柄 识别 DFA 的 状态 。 这 一 集合 中 的 每 个 集合 元 素 成 为 DFA 的 一 个 状态 。 状 态 之 间 的 
转换 遵循 生成 这 一 集合 的 动作 。 例 如 ，goto(CC,，SheepNoise) 是 CC;。 这 给 出 从 状态 CC: 沿 着 文法 符号 
SheepNoise 到 状态 CC; 的 一 个 转换 。 图 3-18 给 出 我 们 为 SN 构建 的 句柄 识别 DFA 。 


3.5.3 填充 表格 


给 定 SN 的 LR(1) 项 目 集合 的 规范 集合 ， 分 析 器 生成 器 可 以 通过 在 CC 上 选 代 并 对 每 个 CCECC 检 查 这 些 
项 目 来 填充 hAction 表 和 6oto 表 。 每 一 个 CC 成 为 分 析 器 的 一 个 状态 。 它 的 项 目 在 4ct7on 表 的 一 列 中 生成 非 空 
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元 素 ; 在 CC 的 构造 期 间 所 记录 的 相应 的 转换 描述 60to 的 非 空 元 素 。 有 三 种 情况 产生 hction 表 中 的 条 目 。 








CCs: 
{[SheepNoise 一 baa SheepNoise ¢, eof} 








CCo: 
{[Goal —> * SheepNoise, eof), 
[SheepNoise — * baa SheepNoise, eof), 
[SheepNoise — + baa, eof]} 


SheepNoise 
















CC: 
{[SheepNoise 一 baa Ħ SheepNoise, eof), 
[SheepNoise — baa e, eof], 
[SheepNoise 一 。baa SheepNoise, eof), 
[SheepNoise ~ © baa, eof} 







CC: 
{[Goal 一 SheepNoise +, eof} 


图 3-18 SheepNoise 文 法 SN 的 句柄 识别 DFA 


1) [4 一 Becy, a] 形 式 的 项 目 表明 过 到 终结 符号 c 将 是 向 着 发 现 非 终结 符号 4 的 一 个 有 效 的 下 一 步 。 因 
此 ， 它 在 当前 状态 下 生成 一 个 对 c 的 移入 。 语 法 识别 器 的 下 一 个 状态 是 通过 计算 对 于 当前 状态 和 c 的 goto |127 
所 生成 的 状态 。 或 7 可 以 是 s。 
2) [4 一 Bp。, al] 形 式 的 项 目 表 示 语 法 分 析 器 已 识别 一 个 6， 如 果 向 前 看 符号 是 a， 那 么 这 个 项 是 一 个 名 
柄 。 因 此 ， 在 当前 状态 下 ， 它 对 于 a 生成 一 个 按 4->B 的 归 约 。 
3) HRSS., eof] 是 惟一 的 。 它 表示 语法 分 析 器 的 接受 状态 ， 语 法 分 析 器 已 经 识别 归 约 到 目标 符 
号 的 输入 流 且 向 前 看 符号 是 eof。 因 此 ， 这 个 项 目 生 成 当前 状态 下 对 eof 的 一 个 接受 动作 。 
图 3-19 具 体 化 这 一 过 程 。 对 于 LR(1) 文法 ， 图 3-19 将 惟一 定义 4ction 表 和 6oto 表 中 的 非 出 错 条 目 。 


for each cc; ECC 
for each item I € cc; 
if I is [A+B e cy,a] and goto(cc;,c) = cc; then 
Action|ic] +- “shift j” 
else if I is [A+Be, a] then 
Action[ia] — “reduce A>” 


else if I is [S'+Se, eof] then 
Action[i eof] + “accept” 
for each n € NT 
if goto(cc;,n) = cc, then 
Goto{i, n] +- j 


图 3-19 LR(1) 表格 填充 算法 


注意 ,表格 填充 算法 实际 上 忽视 占 位 符 。 在 非 终结 符号 前 的 那些 项 目 。 当 在 终结 符 前 时 它 生成 移入 

动作 。 当 ， 在 产生 式 的 右 端 时 ， 它 生成 归 约 动作 和 接受 动作 。 如 果 CC 包 含 项 目 [A4 一 BeY6, a]， 而 YENT 时 

如 何 呢 ? 虽然 这 一 项 目 本 身 不 生成 任何 表格 中 的 条 目 ， 但 是 它 迫 使 c1osure 过 程 包含 生成 表格 条 目的 各 

项 目 。 当 c1osure 找 到 在 非 终 结 符号 ;前 的 * 时 ， 对 于 以 ?为 左 部 的 产生 式 ， 它 在 CCi 中 具体 化 FIRST(7: 

c10sure 寻 找 每 一 个 xEFIRST(7) 并 把 相应 的 可 能 项 目 加 入 到 CC; 中 以 生成 对 每 个 x 的 移入 项 目 。 
当然 ,表格 填充 动作 可 以 合并 到 LR(1) 项 目 集合 的 规范 集合 的 构造 法 中 。 128 
对 于 SheepNoise 文 法 ，LR(1) 项 目 集合 的 规范 集合 构造 法 生成 以 下 两 个 表格 : 
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Action Goto 
状 K eof baa R K SheepNoise 
0 s2 0 1 
1 accept 1 
2 13 s2 2 3 
3 12 3 


这 些 表格 可 以 用 于 图 3-13 中 的 驱动 器 ， 生 成 SN 的 LR(1) 分 析 器 。 


3.5.4 表 构 造 法 的 出 错 


作为 LR(1) 表 构 造 法 的 第 二 个 例子 ,考虑 典型 的 if-then-e1se 结 构 的 歧义 文法 。 抽 象 控 制 表达 式 和 
所 有 其 他 语句 的 细节 (通过 把 它们 当 作 终结 符 ) 生成 如 下 所 示 的 四 产生 式 文 法 : 
这 一 文法 有 两 个 非 终结 符 Goal 和 Stmt， 六 个 终结 符 if、expr、then、e1se、assign 以 及 隐 式 的 eof。 


> Stmt 

— if expr then Stmt 

| if expr then Stmt else Stmt 
| assign 





构造 法 首先 使 用 项 目 [Goal 一 。Stmt，eof] 初 始 化 CCo 同 时 通过 cl1osure 产 生 第 一 个 集合 : 


a [Goal 一 e Stmt, eof], [Stmt + eif expr then Stmt, eof], 
了 [Stmt —> eif expr then Stmtelse Stmt, eof], [Stmt — eassign,eof] 


从 这 一 集合 出 发 ， 构 造 法 逐渐 得 到 LR(1) 项 目 集合 的 规范 集合 的 其 余 成 员 。 
图 3-20 给 出 构造 的 过 程 。 第 一 次 选 代 对 于 每 一 个 文法 符号 检查 从 CCo 出 发 的 转换 。 这 从 CCo 出 发 产生 
规范 集合 的 三 个 新 集合 : 对 Stmt 的 转换 得 到 的 CC,， 对 if 的 转换 得 到 的 CC，， 对 assign 的 转换 得 到 的 CC;。 
这 些 集 合 是 : 
CC1 = { [Goal 一 Stmt e, eof] }, 
{ [Stmt — if e expr then Stmt, eof], 


cGy = 
a [Stmt > if e expr then Stmt else Stmt, eof] 


\ aa 
CC3 = { [Stmt 一 assign e, eof] } 


第 二 次 迭代 检查 从 这 三 个 新 集合 出 发 的 转换 。CC, 和 符号 expr 的 组 合 产 生 惟 一 的 新 集合 : 


ce [Stmt — if expr e then Stmt, eof], 
4 = 
[Stmt + if expr e then Stmtelse Stmt, eof] 


第 三 次 迭代 检查 从 CC4 出 发 的 转换 并 对 符号 then 生 成 CCs: 


[Stmt + if expr then e Stmt, eof], 
[Stmt + if expr then e Stmtelse Stmt, eof], 
CCs= 4 [Stmt— eif expr then Stmt, {eof,else}], 
[Stmt + e assign, {eof, else}], 
- [Stmt > eif expr then Stmtelse Stmt, {eof, elsej] 
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第 四 次 迭代 检查 从 CC; 出 发 的 转换 。 对 Stmt、if 和 assign 分 别 生 成 如 下 集合 : 


ccs = [{Stmt 一 if expr then Stmte, eof], 
[Sent 一 if expr then Stmte else Stmt,eof] f° 


cc [Stmt + if e expr then Stmt,{eof,else}], 
7 一 
[Stmt — if e expr then Stmt else Smt, {eof, else}] 


\ sem 
CCs = { [Stmt > assign e, {eof,else}] } 


第 五 次 迭代 检查 CCes、CC7 和 CCs。 虽 然 大 多 数组 合生 成 空 集 合 ， 但 有 两 个 组 合 导 致 新 集合 。 从 CCe 出 发 
对 else 的 转换 得 到 CCe。， 从 CC7? 对 expr 的 转换 生成 CCio: 


[Stmt 一 if expr then Stmrelse e Stmt, eof}, 
CC = [Stmt 一 eif expr then Sunt, eof), , 并且 
[Stmt > eif expr then Stmtelse Stmt, eof), 


[Stmt + e assign, eof] 


CCio 


[Stmt — if expr e then Stmt, {eof, else)}], 
[Stmt 一 if expr e then Stmt else Stmt, {eof, e1se}] 


当 第 六 次 迭代 检查 第 五 次 迭代 生成 的 集合 时 ， 它 生成 两 个 新 集合 ， 从 CCs 对 Simt 的 转换 得 到 的 CCi 以 及 
从 CCio 对 then 的 转换 得 到 的 CC1,。 它 还 从 CC 开始 生成 两 个 已 有 的 集合 CC; 和 CC 


CCun ={ [Sent if expr then Stmtelse Stmte,eof] }, 并 且 


[Stmt — if expr then e Stmt, {eof else}, 

[Stmt + if expr then Stmtelse Stmt, {eof else}, 
CCi2 = ¢ [Stmt ~ 。 if expr then Stmt, {eof,else}], 

[Stmt + e if expr then Stmtelse Stmt, {eof, else}], 

[Stmt 一 «assign, {eof, else}] 


第 七 次 迭代 生成 从 CC 对 Stmt 的 转换 得 到 的 新 集合 CCs， 同 时 生成 两 个 已 有 的 集合 CC7 和 CCes 的 复制 : 


cca = [Stmt 一 if expr then Stmt e, {eof,e1se}], 
3 | [Stmt— if expr then Stmre else Stmt, {eof,else}] 


BN GERRE—TRRA: 从 CC 对 el1se 的 转换 得 到 的 新 集合 CCi4: 


[Stet + if expr then Stmtelse e Stmt, {eof, else}], 
[Stmt > «if expr then Sint, {eof,else}], 

[Stmt + eif expr then Stmtelse Stmt, {eof, else}], 
[Stmt -> «assign, {eof, else}] 


第 九 次 选 代 从 CC 对 Stmt 的 转换 生成 新 集合 CCis， 并 生成 两 个 已 有 的 集合 CC; 和 CCs: 
CCis ={ [Stmt > if expr then Stmtelse Stmte, {eof,else}] } 
最 后 一 次 选 代 检查 CC1;。 因 为 * 位 于 CCis 中 每 个 项 目的 最 后 ， 所 以 它 只 能 生成 空 集 。 在 这 一 点 ， 没 有 新 
的 项 目 集合 加 入 到 规范 集合 中 ， 所 以 这 一 算法 已 达到 不 动 点 。 它 终止。 
这 一 文法 中 的 歧义 性 在 表格 填充 算法 中 显现 了 出 来 。 从 状态 CC 到 CC 都 不 产生 冲突 。 状 态 CC, 包 
含 四 个 项 目 : 
1) [Stmt > if expr then Stmt e, else}, 


CC = 
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2) [Stmt + if expr then Stmt e, eof], 
3) [Stmt — if expr then Stmt e else Stmt, else], 并 且 
132 4) [Stmt + if expr then Stmt e else Stmt, eof], 


项 目 1 为 CC 和 向 前 看 符号 e1se 生 成 一 个 归 约 条 目 。 项 目 3 为 表格 中 同样 位 置 生成 一 个 移 人 条 目 。 显 然 ， 
表格 中 的 条 目 不 能 同时 持 有 两 个 动作 。 这 一 移入 归 约 冲突 表明 ， 该 文法 是 歧义 的 。 项 目 2 和 项 目 4 对 向 前 
看 符号 eof 生成 类 似 的 移 人 归 约 冲突 。 当 表格 填充 算法 遇 到 这 样 的 冲突 时 ， 这 一 构造 法 就 失败 了 。 表 格 生 
成 器 应 该 向 编译 器 设计 者 报告 这 一 问题 ， 在 特定 的 LR(1) 项 目 中 产生 式 之 间 存在 基本 的 歧义 性 问题 。9 


Coal Stmt i expr then else assign 
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图 3-20 If-then-E1se 文 法 的 LR(1) 构造 法 的 过 程 


对 于 这 种 情况 ， 冲 突 的 出 现 是 因为 文法 中 的 产生 式 2 是 产生 式 3 的 前 级 。 表 格 生 成 器 可 以 按 移入 优先 
的 方式 解决 这 一 冲突 ; 这 也 迫使 分 析 器 识别 较 长 的 产生 式 并 把 e1se 约 束 到 最 内 的 if。 

歧义 文法 也 能 产生 归 约 冲突 。 如 果 文 法 包含 如 下 两 个 产生 式 : A 一 Y6 和 B->Y6， 那 么 就 产生 归 约 冲突 。 
如 果 某 个 状态 包含 项 目 [4 一 Y6* ，a] 和 [8->y6。，a]， 那 么 它 对 于 两 个 产生 式 的 两 个 向 前 看 符号 a 将 生成 两 
个 冲突 的 归 约 动作 。 同 样 ， 这 一 冲突 也 反映 文法 中 的 一 个 基本 的 歧义 性 ; 编译 器 设计 者 必须 重新 制作 文 : 
法 以 消去 歧义 性 (参见 3.6.3 节 )。 

因为 有 许多 自动 化 这 一 过 程 的 分 析 器 生成 器 ， 确 定 一 个 文法 是 否 有 LR(1) 性 质 的 一 个 方法 是 对 这 一 
文法 调用 LR(1) 分 析 器 生成 器 。 如 果 这 一 调用 过 程 成 功 ， 那 么 这 一 文法 有 LR(1) 性 质 。 


3.6 实践 中 的 问题 


| 即使 是 使 用 自动 分 析 器 生成 器 ， 编 译 器 设计 者 也 必须 处 理 若 于 问题 ， 以 产生 现实 程序 设计 语言 的 健 
壮 、 高 效 的 语法 分 析 器 。 本 节 讨 论 实 践 中 发 生 的 若干 问题 。 


O 通常， 错误 信息 包括 产生 这 一 冲突 的 LR(I) 项 目 。 这 是 研究 表 构 造 法 的 另 一 个 原因 。 
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3.6.1 错误 恢复 


程序 员 通常 要 编译 含有 语法 错误 的 代码 。 事 实 上 ， 大 多 数 程序 员 都 认可 编译 器 是 发 现 这 样 的 错误 的 
最 快 方法 。 在 这 一 应 用 中 ， 编 译 器 必须 在 对 代码 的 一 次 语法 分 析 中 尽 可 能 多 地 发 现 语法 错误 。 这 需要 我 
们 留意 在 错误 状态 处 的 语法 分 析 器 行为 。 

本 章 在 给 出 的 所 有 语法 分 析 器 当 遇 到 语法 错误 时 具有 同样 的 行为 : 它们 报告 错误 并 停止 。 这 防止 编 
译 器 浪费 时 间 去 翻译 不 正确 的 程序 。 然 而 ， 这 使 编译 器 在 每 次 编译 至 多 发 现 一 个 语法 错误 。 这 样 的 编译 
器 将 使 语法 错误 的 发 现成 为 一 个 漫长 、 痛 苦 的 过 程 。 

语法 分 析 器 应 该 在 每 次 编译 中 尽 可 能 多 地 发 现 可 能 存在 的 语法 错误 。 这 要 求 让 语法 分 析 器 通过 移动 
到 可 以 继续 分 析 的 状态 ， 从 而 从 错误 中 恢复 过 来 的 机 制 。 达 到 这 一 目标 的 一 般 方法 是 ， 选 择 语法 分 析 器 
可 以 用 于 使 输入 与 它 的 内 部 状态 同步 的 一 个 或 多 个 字 。 当 语法 分 析 器 过 到 一 个 错误 时 ， 它 开始 抛弃 输入 
符号 ， 直 到 它 找到 一 个 同步 的 字 ， 然 后 重新 设置 它 的 内 部 状态 ， 使 其 与 同步 字 一 致 。 

在 分 号 作为 语句 分 隔 符 的 类 Algol 语 言 中 ， 分 号 通常 被 用 作 同 步 字 。 当 一 个 错误 出 现时 ， 语 法 分 析 器 反复 调 
用 扫描 器 ， 直 到 发 现 分 号 。 然 后 ， 它 把 状态 改变 到 一 个 成 功 识 别 完整 语句 的 结果 状态 ， 而 不 是 一 个 错误 状态 。 

在 递归 下 降 分 析 器 中 ， 分 析 器 代码 可 以 简单 地 抛弃 字 直 到 发 现 分 号 。 在 发 现 分 号 的 那 一 点 ， 语 法 分 
析 器 可 以 将 控制 返回 到 分 析 语 名 的 过 程 报告 成 功 的 地 方 。 这 可 能 包括 操作 运行 时 栈 ， 或 使 用 诸如 C 语 言 
的 setjmp 1ongjmp 结 构 的 非 局 部 跳 转 。 


ELRO) 分 析 器 中 ， 这 种 重新 同步 更 加 复杂 。 语 法 分 析 器 抛弃 输入 ， 直 到 找到 一 个 分 号 。 接 着 , 它 


向 下 扫描 分 析 栈 ， 直 到 发 现 一 个 使 得 6otofs, Statement] 是 合法 的 、 非 错误 条 目的 状态 。 然 后 ， 错 误 恢 复 
程序 把 状态 60to[s, Statemen1] 压 入 栈 并 重新 开始 正常 分 析 。 

在 表 驱 动 分 析 器 LL(1) 或 LR(1) 中 ， 编 译 器 需要 一 个 告诉 语法 分 析 器 生成 器 同步 地 点 的 方法 。 使 用 
错误 产生 式 可 以 做 到 这 一 点 。 所 谓 的 错误 产生 式 就 是 它 的 右 部 包含 表明 错误 同步 地 点 的 保留 字 和 一 个 或 
多 个 同步 记号 。 使 用 这 样 的 结构 ， 分 析 器 生成 器 可 以 构造 实现 希望 行为 的 错误 恢复 程序 。 

当然 ， 错 误 恢 复 程序 应 该 采取 这 样 的 步骤 以 保证 编译 器 对 语法 上 不 正确 的 程序 不 尝试 生成 及 优化 代 
码 。 这 要 求 在 错误 恢复 设备 与 调用 编译 器 各 个 部 分 的 高 层 驱 动 器 之 间 的 一 个 简单 的 握手 。 


3.6.2 一 元 操作 符 


经 典 表达 式 文 法 只 包含 二 元 运算 符 。 然 而 ， 标 准 代数 表 记 既 包 含 一 元 减 、 或 否定 操作 符 ， 又 包含 绝 ， 


对 值 操作 符 。 程 序 设计 语言 中 还 有 其 他 一 元 操作 符 ， 包 括 布尔 求 补 、 自 增 、 自 减 、 类 型 转换 、 取 地 址 和 
解除 引用 。 把 一 元 操作 符 加 入 到 这 种 文法 表达 式 中 时 需要 小 心 。 
考虑 把 一 元 绝对 值 操作 符 | | 加 入 到 经 典 表 达 式 文法 中 。 绝 对 值 比 x 或 + 有 更 高 的 优先 权 。 然 而 ， 绝 
对 值 需要 比 Factor 的 优先 权 低 以 便 在 使 用 | | 之 前 强制 做 括号 表达 式 的 评估 。 这 导致 以 下 文法 : 
Expr => Expr+Term 
| Expr- Term 
| Term 
+ Term» Value 
| Term+ Value 
| Value 
Value 一 || Factor 
| Factor 
> (Expr) 
| num 
| ident 
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带 着 这 些 附 加 部 分 ， 文 法 仍然 是 LR(1) 的 。 它 使 程序 员 可 以 形成 数 的 绝对 值 、 标 识 符 的 绝对 值 以 及 括号 
表达 式 的 绝对 值 。 字 符 串 | |x-~3 产 生 如 下 分 析 树 : 


Goal 


Term Value 


| | 


Value Factor 


| 


LI Factor <num,3> 


aako 
这 一 分 析 树 正确 地 表明 这 一 代码 必须 在 执行 减法 之 前 评估 | |x。 这 一 文法 不 允许 程序 员 书 写 | | | jx， 因 为 
它 没有 数学 意义 。 然 而 ， 它 却 允 许 书写 | |(| lx)， 这 与 | | | x 同样 没有 意义 。 

不 能 书写 | | | |x 不 会 限定 语言 的 表示 能 力 。 然 而 ， 对 于 其 他 一 元 操作 符 ， 这 一 问题 似乎 更 严重 。 例 
如 ，C 语 言 程 序 员 需要 书写 **p 对 声明 为 char **p; 的 变量 解除 引用 ; 我 们 也 可 以 加 入 Value 的 解除 引用 产 
生 式 : Value 一 *Value。 结 果 文 潜 仍 是 LR(1) 文法 ， 即 使 我 们 在 Term 一 Term x Value 中 用 * 中 替换 掉 x ， 按 
C 语 言 的 方式 重 载 “*” 也 是 如 此 。 也 可 以 对 一 元 减 采 用 同样 的 做 法 。 





3.6.3 处 理 上 下 文 相关 歧义 性 


使 用 一 个 字 表 示 两 个 不 同意 义 可 以 造成 语法 歧义 性 。 在 早期 的 若干 程序 设计 语言 ， 包 括 FORTRAN.、 
PL/4 和 Ada 的 定义 中 出 现 了 这 一 问题 。 在 这 些 语 言 中 ， 括 号 既 将 数组 引用 的 下 标 表 达 式 括 起 来 ， 也 将 子 
程序 或 函数 的 参数 列表 括 起 来 。 给 定 一 个 文本 引用 ， 例 如 fee(i，j)， 编 译 器 无 法 知道 fee 是 一 个 二 维 数 
组 还 是 一 个 必须 被 调用 的 过 程 。 为 了 分 清 这 两 种 情况 ， 我 们 需要 了 解 fee 的 声明 类 型 的 信息 。 这 一 信息 
在 语法 上 是 不 清楚 的 。 对 于 任意 一 种 情况 ， 扫描 器 都 之 无 疑问 地 把 fee 归 类 为 1dent。 函 数 调用 和 数组 引 
136| ”用 可 以 出 现 于 很 多 相同 的 情况 中 。 


这 些 结构 都 不 出 现 于 经 典 表达 式 文法 中 。 我 们 可 以 加 入 产生 式 ， 使 其 能 够 从 Factor 派 生出 来 : 


Factor —  FunctionReference 

| ArrayReference 

| (Expr) 

| num 

| ident 
FunctionReference — ident ( ExprList ) 
ArrayReference — ident ( ExprList ) 


因为 最 后 两 个 产生 式 有 相同 的 右 部 ， 这 一 文法 是 歧义 的 。 这 给 LR(1) 表 构 建 程序 带 来 一 个 归 约 冲突 。 

解决 这 一 歧义 性 需要 语法 之 外 的 信息 。 在 递归 下 降 分 析 器 中 ， 编 译 器 设计 者 可 以 简单 地 把 Furctiom- 
Reference 和 ArrayReference 的 代码 结合 起 来 ， 并 加 入 检查 这 一 ident 的 声明 类 型 所 需 的 额外 代码 。 对 于 使 
用 工具 构建 的 表 驱 动 分 析 器 ， 该 工具 必须 具有 这 样 的 解决 方案 。 
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多 年 来 ， 我 们 使 用 两 个 不 同 的 方法 解决 这 一 问题 。 编 译 器 设计 者 可 以 重 写 文法 ， 把 函数 调用 和 数组 
引用 结合 起 来 形成 单一 的 产生 式 。 在 这 样 的 方案 中 ， 这 一 问题 被 推迟 到 后 期 的 翻译 阶段 ， 在 那里 可 以 通 
过 声明 的 信息 解决 这 一 问题 。 语 法 分 析 器 必须 构造 保存 两 种 可 能 的 所 需 信息 的 表示 ; 后 面 的 步 台 将 把 这 
一 引用 重 写 成 适当 的 形式 : 数组 引用 或 函数 调用 。 

另外 ， 扫 描 器 可 以 基于 标识 符 的 声明 类 型 ， 而 不 是 它们 的 微 语法 性 质 对 其 分 类 。 这 要 求 扫描 器 与 语 
法 分 析 器 之 间 的 某 种 担 和 手 ; 只 要 语言 有 “使 用 前 定义 ”的 规则 ， 那 么 这 样 的 合作 就 不 是 很 困难 。 因 为 声 
明 是 在 使 用 之 前 被 分 析 的 ， 所 以 语法 分 析 器 可 以 使 它 的 内 部 符号 表格 对 扫描 器 可 用 来 解决 把 标识 符 分 类 
成 例如 variable-name 和 function-name 等 不 同类 别 的 问题 。 相 关 的 产生 式 变 成 

FunctionReference — function-name ( ExprList ) 
ArrayReference = variable-name ( ExprList ) 


按 这 种 方式 重 写 ,文法 是 非 歧义 的 。 因 为 扫描 器 对 于 每 种 情况 都 返回 一 个 不 同 的 语法 范畴 ， 分 析 器 可 以 
区 分 这 两 种 情况 。 


3.6.4 左 递归 与 右 递 归 


正如 我 们 已 经 看 到 的 那样 ， 自 顶 向 下 分 析 器 需要 右 递 归 文法 而 不 是 左 递归 文法 。 自 底 向 上 分 析 器 可 
以 适应 于 左 递归 文法 和 右 递归 文法 两 种 情况 。 因 此 ， 编 译 器 设计 者 在 为 自 底 向 上 分 析 器 设计 文法 时 可 以 
， 在 左 递归 和 右 递归 之 间 做 出 选择 。 以 下 几 个 因素 影响 选择 。 

1. 栈 的 深度 

一 般 地 ， 左 递归 可 以 导致 一 个 较 补 的 栈 深度 。 考 虑 两 个 简单 列表 结构 文法 。( 注意 与 SheepNoise 文 
法 的 类 似 性 。) 

List — List eit List — elt List 
| elt | elt 


使 用 两 个 文法 的 每 个 文法 生成 一 个 五 元 素 的 列表 ， 我 们 有 下 面 的 派生 : 


List List 
List elts elt, List 
List elt, elts; elt; elt, List 
List elt; elt, elts elt; elt, elt; List 
Listeltz elt; eltgelts elt; elt, elt; elt, List 
elt, elt, elt; elt, elts elt, elt, elt; elt, elts 
因为 语法 分 析 器 以 相反 顺序 构造 这 些 序列 ， 我 们 可 以 按 从 最 底 行 向 上 读 取 每 个 派生 来 跟踪 语法 分 析 器 的 
动作 。 
(1) 左 递归 


这 一 文法 把 elt ,移入 到 它 的 栈 中 并 马上 把 它 轨 约 成 List。 接 着 ， 这 一 文法 把 e1t, 移 入 到 栈 中 并 把 它 归 
约 成 List。 持 续 这 一 过 程 ， 直 到 已 把 每 个 e1t ,移入 到 栈 中 并 把 它们 归 约 到 List。 因 此 ， 栈 达到 的 最 大 深度 


为 2， 且 平均 深度 为 了 12， 


3 
(2) 右 递归 
这 一 版 本 把 所 有 五 个 e1t 都 移入 到 栈 中 。 接 着 ,使 用 规则 2 把 e1ts 归 约 成 List， 使 用 规则 1 处 理 其 余 的 





82 £3* 





1 
elts Fk, CRRKRRAS, PHREH = 35, 


右 递归 文法 需要 更 多 的 栈 空间 ;事实 上 ， 它 的 最 大 栈 深 被 列表 的 长 度 惟 一 定 界 。 相 反 ， 左 递归 文法 的 最 
大 栈 深 度 是 文法 的 函数 而 不 是 输入 流 的 函数 。 

对 于 短 列 表 ， 栈 空间 不 是 问题 。 然 而 ， 如 果 列 表 表 示 很 长 的 直线 代码 的 语 名 列表， 那么 它 可 以 有 上 
百 个 元 素 。 在 这 种 情况 下 ， 空 间 的 差异 可 能 是 巨大 的 。 如 果 所 有 其 他 问题 都 一 样 的 话 ， 较 小 的 栈 深 具 有 
优越 性 。 

2. 结合 性 

左 递 归 自 然 地 生成 左 结合 性 ， 右 递归 自然 地 生成 右 结合 性 。 在 某 些 情况 下 ,评估 的 顺序 产生 很 大 的 
差异 。 考 虑 前 面 构造 的 五 元 素 列 表 的 抽象 语法 树 (AST)。(AST 可 以 消除 分 析 树 中 的 很 多 结 点 。) 


elts elti 
elt; elt, 
elt; elt; 
elt, elt, elt, elts 


左 递归 文法 把 e1t: 归 约 成 List， 然 后 归 约 Lisr elt:， 以 此 类 推 。 这 生成 上 图 左边 的 AST。 同 样 地 ， 碳 
递归 文法 生成 上 图 右边 所 示 的 AST。 

对 于 一 个 列表 ， 这 些 顺 序 显然 没有 一 个 是 显然 正确 的 ， 尽 管 右 递 归 的 AST 看 起 来 可 能 更 自然 一 些 。 
然而 ， 例 如 考虑 按 下 面 的 文法 用 算术 运算 替换 列表 结构 : 


Expr — Expr + Operand Expr = Operand + Expr 
| Expr - Operand | Operand - Expr 
| Operand | Operand 


对 于 字符 串 Xi + xz + xs + X4 + xs， 左 递归 文法 导致 从 左 到 右 的 评估 顺序 ， 而 右 递归 文法 导致 从 右 到 左 的 
评估 上 顺序。 使 用 某 个 数 系 ， 如 计算 机 上 的 浮 点 算术 ， 这 两 种 评估 顺序 可 以 产生 不 同 的 结果 中 。 如 果 运 算 
中 的 任意 项 是 函数 调用 ， 那 么 评估 顺序 可 能 很 重要 。 如 果 函 数 调 用 改变 表达 式 中 的 变量 值 ， 那 么 评估 顺 
序 的 改变 也 可 能 改变 结果 。 

在 带 有 减法 的 字符 串 ， 如 xi - xz + xs 中 ， 改 变 评估 顺序 可 能 产生 不 正确 的 结果 。 左 结合 在 对 树 的 后 
序 遍 历 过 程 中 将 该 字符 串 评估 为 (xi - xa) + xs， 这 是 我 们 希望 的 结果 。 另 一 方面 ， 右 结合 导致 评估 顺序 
Xi 一 (Xz + Xs)。 当 然 ， 编 译 器 必须 保持 语言 定义 指定 的 评估 顺序 。 编 译 器 设计 者 可 以 用 如 下 两 种 方式 保持 
指定 的 评估 顺序 : 书写 生成 所 希望 的 顺序 的 表达 式 文 法 ， 或 者 如 4.5.2 节 所 述 ， 小 心地 生成 中 间 表 示 以 反 
映 正 确 的 评估 顺序 和 结合 性 。 


3.7 高 级 话题 


为 了 构建 一 个 令 人 满意 的 语法 分 析 器 ， 编 译 器 设计 者 必须 理解 设计 文法 和 语法 分 析 器 的 基础 。 给 定 
一 个 语法 分 析 器 ， 通 常 存在 若干 改进 其 性 能 的 方法 。 本 节 考 察 语 法 分 析 器 构造 法 中 的 两 个 话题 ， 一 个 是 
优化 文法 以 减 小 派生 的 长 度 〈 同 时 增加 分 析 的 速度 ) 的 方法 ， 一 个 是 减 小 LR(1) 分 析 器 中 Action 表 和 


_6oto 表 大 小 的 方法 。 


但” 因为 浮 点 数 相对 于 指数 的 范围 而 言 具 有 较 小 的 尾数 ， 所 以 对 于 数量 级 相差 很 大 的 两 个 数 ， 加 法 变 成 对 于 其 
中 的 较 大 数 的 恒 等 运 算 。 例 如 ， 如 果 Xs 远 远 小 于 xs， 那 么 处 理 器 将 计算 xs + xs = x;。 对 于 参数 的 某 些 值 ， 这 
一 影响 可 能 会 登 加 起 来 ， 导 致 从 左 到 右 和 从 右 到 左 的 评估 给 出 不 同 的 结果 。 
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3.7.1 优化 文法 


虽然 语法 分 析 不 再 是 消耗 编译 时 间 的 主要 因素 ， 编 译 器 不 应 在 语法 分 析 中 无 节制 地 浪费 时 间 。 文 法 
的 实际 形式 直接 影响 分 析 时 所 需 的 工作 量 。 自 顶 向 下 和 自 底 向 上 分 析 器 都 构建 派生 。 自 顶 向 下 分 析 器 对 
派生 中 的 每 个 产生 式 执行 一 次 展开 。 自 底 向 上 分 析 器 对 于 派生 中 的 每 个 产生 式 执行 一 次 归 约 。 产 生 较 短 
派生 的 文法 花费 在 分 析 的 时 间 较 少 。 

编译 器 设计 者 通常 可 以 通过 重 写 文法 来 降低 分 析 树 的 高 度 。 这 可 以 减少 自 顶 向 下 分 析 器 中 展开 的 数 
目 ， 减 少 自 底 向 上 分 析 器 中 的 归 约 数目 。 优 化 文法 不 能 改变 语法 分 析 器 的 渐 近 行为 ; 毕竟 ， 分 析 树 必 须 
对 输入 流 中 的 每 个 符号 生成 一 个 叶 结 点 。 然 而 ， 大 幅度 降低 多 用 于 文法 部 分 ， 如 表达 式 文 法 的 ( 渐 近 ) 
常数 可 以 产生 很 大 的 差异 。 

再 次 考虑 3.2.3 节 中 的 经 典 表达 式 文 法 。 为 了 使 各 运算 符 拥有 期 望 的 优先 权 ， 我 们 加 入 了 两 个 非 终结 
符 : Term 和 Factor, 并且 把 这 一 文法 重 构成 现在 的 形式 : 


Expr + Term 
Expr - Term 
Term 

Term x Factor 
Term + Factor 
Factor 

( Expr ) 

num 

ident 


—--J—--1-- 4 





这 导致 相当 大 的 分 析 树 ， 甚 至 是 对 于 简单 的 表达 式 也 是 如 此 。 正 如 我 们 在 图 3-10 所 看 到 的 那样 ，x- 
2 x y 的 分 析 树 有 十 四 个 结 点 ， 其 中 五 个 是 叶 结 点 。( 我 们 不 能 最 优化 掉 这 些 叶 子 。 文 法 的 改变 不 能 缩短 
输入 程序 ! ) 141 


Term Term X Factor 
Factor Factor <ident,y> 


<ident,x> <num,2> 


所 有 只 有 一 个 子 结 点 的 结 点 都 是 优化 的 候选 。 结 点 Expr 到 Term 再 到 Factor 再 到 <ident ，x> 这 一 序列 对 于 
输入 流 中 的 一 个 字 使 用 了 四 个 结 点 。 通 过 在 文法 中 向 上 折合 Factor 的 可 能 展开 ， 我们 至 少 可 以 消去 
Factor 结 点 层 。 也 就 是 说 ， 使 用 Factor 的 三 个 选择 取代 在 各 产生 式 右 部 的 Factor 的 各 个 出 现 。 


Term 一 Termx(Expr) | Termxident | Termxnum 
| Term+(Expr). | Term+ident | Term+num 
| ( Expr ) | ident | num 


这 使 Term 的 选择 的 数目 增加 2 倍 ， 但 是 ， 缩 小 一 层 分 析 树 。 
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Term Term X<ident,y> 


<i eto <num,2> 

在 自 顶 向 下 递归 下 降 分 析 器 中 ， 这 可 以 消去 十 四 次 过 程 调用 中 的 三 个 。 在 LR(1) 分 析 器 中 ， 它 消去 
九 个 妇 约 动作 中 的 三 个 ， 而 移入 的 次 数 仍 保持 不 变 。 

一 般 地 ， 我 们 可 以 折 肥 任意 右 部 为 单一 符号 的 产生 式 。 这 些 产生 式 称 为 无 用 产生 式 (useless 
production)。 有 了 时， 无 用 产生 式 出 于 某 种 目的 : 使 文法 更 紧凑 、 也 许 是 可 读 性 更 强 ， 也 许 是 迫使 派生 呈 
现 某 一 特殊 形式 。( 回想 最 简单 的 表达 式 文法 接受 x-2 x y， 但 却 不 能 在 分 析 树 描绘 优先 权 。 ) 正如 我 们 将 
在 第 4 章 所 看 到 的 那样 ， 编 译 器 设计 者 可 能 单纯 为 了 在 派生 中 创建 一 个 断 点 而 包含 无 用 产生 式 ， 以 便 在 
这 样 的 断 点 实施 特定 的 动作 。 

折 和 登 无 用 产生 式 的 这 种 变换 也 有 它 的 代价 。 在 LR(1) 分 析 器 中 ， 这 种 变换 可 以 使 表格 增 大 。 在 我 们 
的 例子 中 ， 消 除 Factor 使 G60to 表 移出 一 列 ， 但 是 ，Term 的 额外 产生 式 使 CC 的 大 小 从 32 个 集合 增加 到 46 
个 集合 。 因 此 ， 表 格 少 一 列 ， 但 是 却 增 加 14 行 。 结 果 语 法 分 析 器 拥有 更 少 的 归 约 (运行 更 快 ),， 但 却 有 
一 张大 表格 。 

在 手工 编码 的 递归 下 降 分 析 器 中 ， 较 大 的 文法 可 能 增加 在 展开 某 个 左 部 之 前 必须 比较 的 选择 的 数 
目 9 。 编 译 设计 者 也 许 能 够 通过 结合 各 种 情况 来 补偿 这 增加 了 的 代价 。 例 如 ， 图 3-7 中 的 两 个 非 平 凡 的 
Expr' 展 开 的 代码 是 相同 的 。 编 译 器 设计 者 可 以 用 word 与 + 或 -的 匹配 检测 把 它们 合并 起 来 。 另 外 ， 编 译 
器 设计 者 也 可 以 设 定 + 和 -为 相同 语法 范畴 ， 让 分 析 器 检查 这 一 语法 范畴 ， 并 在 需要 时 使 用 这 个 字 的 实际 
文本 来 区 分 二 者 。 


3.7.2 减 小 LR(1) 表格 的 大 小 


正如 图 3-14 和 3-15 所 示 ， 相 对 于 较 小 的 文法 生成 的 LR(1) 表格 也 可 能 很 大 。 有 许多 缩小 这 一 表格 的 
技术 。 本 节 给 出 三 种 减 小 表格 大 小 方法 。 

1. 合并 行 或 列 

如 果 表 格 生成 器 能 够 找到 内 容 相同 的 两 行 或 两 列 ， 那 么 表格 生成 器 可 以 把 它们 合并 起 来 。 在 图 3-14 
中 ， 对 应 于 状态 0， 以 及 状态 7 到 状态 10 的 各 行 是 相同 的 ， 它 们 是 第 4、14、21、22、24、25 行 。 这 一 表 
格 生成 器 可 以 实现 这 些 集合 各 一 次 ， 然 后 重新 映射 这 些 状态 。 这 将 从 表格 移出 九 行 ， 把 它 的 大 小 减少 
28% 。 为 了 使 用 这 一 表格 ， 框 架 分 析 器 需要 一 个 从 分 析 器 状态 到 4ction 表 中 的 行 下 标的 映射 。 这 一 表格 
生成 器 使 用 类 似 的 方法 合并 相同 的 列 。 对 于 6oto 表 的 独立 检查 将 导致 一 个 不 同 的 状态 组 合集 合 ， 特 别 是 
只 包含 零 的 所 有 行将 浓缩 到 一 行 中 。 

在 某 些 情 况 下 ， 表 格 生成 器 能 发 现 两 行 或 两 列 只 在 下 面 的 情况 下 不 同 : 其 中 的 两 行 或 两 列 中 的 一 个 
有 一 个 “错误 ”条 目 (在 我 们 的 图 中 记 作 空 白 . ) 在 图 3-14 中 ，eof 列 和 pum 列 只 在 其 中 的 一 个 有 空白 的 
地 方 不 同 。 把 这 些 列 合并 起 来 产生 对 正确 的 输入 有 相同 行为 的 表格 。 seh A EREINEN 
为 ， 并 有 可 能 减弱 分 析 器 提供 精确 、 有 帮助 的 错误 信息 的 能 力 。 


日 不 要 让 这 一 讨论 误导 你 认为 使 用 这 种 方式 修改 的 经 典 表达 式 文 法 是 LL(1) 文法 。 回 想 这 一 文法 需要 修改 以 
使 它 能 够 预测 分 析 。 同 样 的 变换 适用 于 这 一 文法 的 当前 版 本 。 
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合并 行 和 列 可 以 直接 减少 表格 的 大 小 。 如 果 这 一 空间 的 减少 对 每 次 表 存 取 加 入 额外 的 间接 处 理 ， 那 
么 我 们 必须 在 这 些 内 存 操作 的 代价 与 内 存 的 节约 间 进 行 直接 的 权衡 。 表 格 生成 器 也 可 以 使 用 其 他 技术 来 
表示 稀 朴 和 矩阵， 同样， 实现 者 必须 在 存 取代 价 的 增加 与 内 存 大 小 间 进 行 权衡 。 

2. 缩小 文法 

在 很 多 情况 下 ， 编 译 器 设计 者 可 以 重 写 文法 来 减 小 文法 包含 的 产生 式 的 数目 。 这 通常 导致 较 小 的 表 
格 。 例 如 ， 在 经 典 表达 式 文法 中 ， 数 字 和 标识 符 之 间 的 差异 与 Goal、Expr、Term 和 Factor 产 生 式 无 关 。 
使 用 一 个 产生 式 Factor 一 val 取 代 Factor 一 num 和 Factor 一 ident 这 两 个 产生 式 将 使 文法 减少 一 个 产生 式 。 
在 4ction 表 中 ， 每 个 终结 符 都 有 自己 的 列 。 将 num 和 ident 折 释 成 单一 符号 val 使 4ction 表 减少 一 列 。 在 
实践 中 ， 为 了 完成 这 一 工作 ， 对 于 num 和 ident ， 扫 描 器 对 num 和 ident 必 须 返 回 到 相同 的 语法 范畴 ， 或 字 。 

类 似 的 讨论 也 适 于 把 x 和 := 合并 成 单一 终结 符 muldiv， 而 把 + 和 -合并 成 单一 终结 符 addsub 。 这 些 替 
换 中 的 每 个 都 将 消去 一 个 终结 符 和 一 个 产生 式 。 以 上 在 三 个 改变 生成 如 下 的 缩小 的 表达 式 文 法 : 


Expr 

Expr addsub Term 
Term 
Term muldiv Factor 
Factor 

( Expr ) 

val 





这 一 文法 生成 较 小 的 CC， 从 表格 中 消去 一 些 行 。 因 为 这 一 文法 有 较 少 的 终结 符 ， 因 此 它 也 只 有 较 少 的 列 。 

结果 4ction 表 和 6oto 表 如 图 3-21 所 示 。M4ction 表 包含 132 个 条 目 ， 而 6oto 表 包含 66 个 条 目 ， 总 共 
198 个 条 目 。 与 原来 文法 中 的 共计 384 个 条 目的 表格 相 比 非常 好 。 改 变 文法 将 使 表格 的 大 小 减 小 48% 。 然 
而 ， 需 要 注意 的 是 ， 这 些 表格 仍然 包含 重复 行 ， 如 4ction 表 中 的 0、6 和 7 行 以 及 4Mction 表 中 的 4、11、15 
和 17 行 是 重复 的 ， 在 6oto 表 中 也 有 相同 的 行 。 如 果 我 们 对 表格 的 大 小 非常 关注 的 话 ， 可 以 把 这 些 技术 结 
合 起 来 使 用 。 

对 于 其 他 方面 的 考虑 也 许 会 限制 编译 器 设计 者 合并 产生 式 的 能 力 。 例 如 ，x 操作 符 可 能 有 多 种 用 法 ， 
MAKES + 合并 起 来 就 会 变 得 不 现实 。 同 样 地 ， 语 法 分 析 器 可 能 使 用 不 同 的 产生 式 ， 以 使 语法 分 析 器 
用 不 同 的 方法 处 理 这 两 个 语法 上 类 似 的 结构 。 

3. 直接 编码 表格 

作为 最 后 一 项 改进 ， 分 析 器 生成 器 可 以 完全 放弃 表 驱 动 框架 分 析 器 而 支持 手工 编码 实现 。 每 个 状态 
变 成 一 个 小 的 选择 语句 或 一 系列 测试 下 一 个 字符 的 类 型 的 if-then-e1se 语 句 ,以 此 来 判断 是 移 人 、 归 约 、 
接受 还 是 报告 错误 。 可 以 使 用 这 种 方法 编写 4ction 表 和 6oto 表 的 条 目 。(2.5.2 节 已 讨论 了 扫描 器 的 类 似 
转换 。) 

结果 语法 分 析 器 回避 我 们 在 图 中 用 空白 表示 的 4ction 表 和 6oto 表 中 的 所 有 “无 关 ” 状 态 的 直接 表示 。 
代码 的 增 大 可 能 抵消 这 一 空间 节约 ， 因 为 此 时 每 个 状态 都 包含 更 多 的 代码 。 然 而 ， 新 语法 分 析 器 没有 分 
析 表 ， 不 执行 表 查 找 ， 没 有 在 框架 分 析 器 中 的 外 部 循环 。 虽然 新 语法 分 析 器 的 结构 变 得 令 人 几乎 无 法 读 
fit, 但 是 它 要 比 相应 的 表 驱 动 分 析 器 运行 得 更 快 。 使 用 适当 的 代码 布局 技术 ， 结 果 语 法 分 析 器 可 以 在 结 
构 缓冲 器 和 分 页 系统 两 方面 展示 强大 的 局 部 化 。 典 型 例子 是 把 表达 式 文 法 的 所 有 过 程 放 置 在 不 会 产生 彼 
此 冲突 的 单一 页 面 上 。 
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图 3-21 缩小 的 表达 式 文 法 的 表格 


4. 使 用 其 他 构造 算法 

存在 若干 构造 LR 类 型 分 析 器 的 其 他 算法 。 其 中 包括 SLR(1) 构造 法 和 LALR(1) 构造 法 。SLR(1) BA 
#(simple) LR(1) 的 缩写 ， LALR(1) 是 向 前 看 lookahead) LR(1) 的 缩写 。 这 两 个 构造 法 生成 的 表格 都 比 
规范 LR(1) 算法 生成 的 表格 小 。 

SLR(1) 算法 接受 的 文法 类 比 规范 LR(1) 构造 法 接受 的 文法 类 小 。 这 些 文法 局 限于 那些 不 需要 LR(1) 
项 目 中 的 向 前 看 符号 的 文法 。 这 一 算法 使 用 FOLLOW 集合 来 区 分 分 析 器 应 该 移 人 还 是 归 约 这 两 种 情况 。 
在 实践 中 ， 这 一 机 制 足 以 处 理 很 多 实际 的 文法 。 通 过 使 用 FOLLOW 集合 ， 算 法 消除 需要 向 前 看 符号 的 必 
要 性 。 从 而 生成 较 小 的 规范 集合 以 及 相应 的 行 数 较 少 的 表格 。 

LALR(1) 算法 利用 这 样 的 观察 : 表示 状态 的 集合 中 的 某 些 项 目 是 关键 的 ， 而 其 他 项 目 则 可 以 从 那些 
关键 项 目 派生 出 来 。LALR(1) 的 表 结 构 只 表示 关键 项 目 ; 从 而 生成 与 SLR(1) 构造 法 生成 的 规范 集合 等 
价 的 规范 集合 。 表 格 的 细节 有 些 不 同 ， 但 是 表格 的 大 小 是 一 样 的 。 

本 章 较 早 提出 的 LR(1) 构造 法 是 这 些 表 构造 算法 中 最 一 般 的 算法 。 它 生成 最 大 的 表格 ， 但 是 接受 最 
大 的 文法 类 。 使 用 适当 的 表格 减 小 技术 ，LR(1) 表格 可 以 接近 那些 由 有 更 多 限制 的 技术 生成 的 表格 的 大 
小 。 然 而 ， 作 为 一 个 非 显 然 的 结果 ， 有 LR(1) 文法 的 任意 语言 都 有 LALR(D 文法 和 SLR(1) 文法 。 使 用 某 
种 方法 形成 这 些 受到 更 多 限制 的 文法 形式 将 允许 我 们 使 用 相应 的 构造 算法 来 解决 分 析 器 何 时 该 移 入 ， 何 
时 该 归 约 的 问题 。 


3.8 概括 和 展望 
几乎 每 个 编译 器 都 包含 语法 分 析 器 。 很 多 年 来 ， 语 法 分 析 是 一 个 非常 令 人 感 兴趣 的 课题 。 从 而 导致 
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构建 高 效 语法 分 析 器 的 各 种 技术 的 发 展 。 文 法 LR(1) 系列 包含 所 有 能 够 用 确定 的 形式 分 析 的 上 下 文 无 关 
文法 。 这 些 工 具 构 建 带 有 强大 的 错误 检测 功能 的 高 效 语 法 分 析 器 。 这 些 特性 的 结合 ， 加 之 LR(1)、 
LALR(1)、SLR(1) 文法 的 诸多 分 析 器 生成 器 ,减弱 了 人 们 对 其 他 自动 分 析 技 术 ( 例 如 ，LL(1) 分 析 和 算 
符 优先 权 分 析 ) 的 兴趣 。 

自 顶 向 下 、 递 归 下 降 分 析 器 有 其 自身 的 优越 性 。 可 以 证 论 ， 它 们 是 最 易手 工 构建 的 语法 分 析 器 。 它 
们 提供 发 现 和 修改 语法 错 语 的 最 佳 可 能 。 编 译 器 设计 者 较 容易 处 理 给 LR(1) 分 析 器 带 来 麻烦 的 源 程序 中 
的 歧义 性 ， 诸 如 那些 关键 字 名 字 可 能 作为 标识 符 出 现 的 语言 中 的 歧义 性 。 自 顶 向 下 、 递 归 下 降 分 析 器 是 
高 效 的 ;事实 上 ， 精 心 构造 的 自 顶 向 下 、 递 归 下 降 分 析 器 比 表 驱 动 LR(1) 分 析 器 更 快 。(LR(1) 的 直接 编 
码 设计 可 以 战胜 这 一 速度 上 的 优势 。) 无 论 出 于 什么 理由 ， 想 要 构造 手工 编码 分 析 器 的 编译 器 设计 者 都 
应 该 使 用 自 顶 向 下 、 递 归 下 降 方法 。 

还 有 更 一 般 的 语法 分 析 算 法 。 然 而 在 实践 中 ， 对 于 绝 大 多 数 程序 设计 语言 ，LR(1)、LL(1) 文法 类 对 
上 上下文 无 关 文法 的 限制 不 会 引起 什么 问题 。 

在 LR(1) 和 LL(1) 文法 之 间 的 选择 ， 关 键 的 问题 是 是 否 有 合适 的 工具 。 事 实 上 ， 很 少 有 程序 设计 语 
言 是 处 于 LR(1) 文法 与 LL(1) 文法 之 间 的 。 因 此 ， 以 已 有 的 适当 分 析 器 生成 器 开始 总 是 要 好 过 从 头 实现 
分 析 器 生成 器 。 


本 章 注释 


最 早 的 编译 器 使 用 手写 编码 语法 分 析 器 [26，304，221]。Algol 60 的 丰富 语法 给 早期 的 编译 器 设计 
者 带 来 挑战 。 他 们 尝试 各 种 方案 来 分 析 这 一 语言 ; Randell 和 Russell 对 各 种 Algol 60 编 译 器 所 用 的 分 析 方 
法 给 出 了 迷人 的 概述 [282， 第 1 章 ]。 | 

_Irons 是 将 语法 从 翻译 中 分 离 出 来 的 第 一 人 之 一 [191]。 似 乎 是 Lucas 引 入 了 递归 下 降 分 析 的 表 记 法 
[246]。Conway 把 类 似 的 想法 运用 于 COBOL 的 高 效 单 遍 编译 器 [91]。 

LL 和 LR 分 析 缘 后 的 思想 出 现 于 20 世 纪 60 年 代 。Lewis 和 Stearns 描 述 了 LL(k) 文法 [236]; Rosen- 
krantz 和 Stearns 更 深入 地 描述 了 这 些 文法 的 性 质 [294] 。Foster 开 发 了 把 文法 转换 成 LL(1) 形式 的 算法 
[144]。 Wood 形 式 化 了 提取 左 因子 的 概念 并 揭示 了 在 把 文法 转换 成 LL(1) 形式 的 过 程 中 涉及 的 理论 问题 [148 
(336, 337, 338]. 

Knuth 葛 定 了 LR(1) 分 析 背 后 的 理论 [217]。 随 着 SLR 和 LALR 表 格 的 出 现 ，DeRemer 等 将 这 一 理论 付 
诸 实 践 [113，114]。Waite 和 Goos 说 明了 在 LR(1) 表 构 造 法 算法 中 自动 消除 无 用 产生 式 的 技术 [326]。 
Penello 提 出 直接 将 这 些 表格 编写 成 可 执行 代码 的 方案 [272]。 对 于 LL 和 LR 分 析 ，Aho、Johnson 和 
Ullman[9] 是 权威 性 的 参考 书 。 

分 析 任 意 上 下 文法 无 关 文 法 的 若干 算法 出 现 于 20 世 纪 60 年 代 和 20 世 纪 70 年 代 早 期 。Cocke 和 
Schwartz[86] 的 算法 、Younger[341] 的 算法 、Kasami[201] 的 算法 以 及 Earley[126] 的 算法 都 有 类 似 的 计算 
复杂 性 。Earley 的 算法 值得 一 提 ， 因 为 这 一 算法 与 LR(1) 表 构 造 法 算法 类 似 。Earley 算 法 在 分 析 时 ， 而 不 
是 在 执行 时 得 到 可 能 分 析 状 态 的 集合 ， 而 LR(1) 技术 在 分 析 器 生成 器 中 预先 计算 这 些 状态 。 从 更 高 级 的 
角度 看 ，LR(1) 算法 可 以 看 成 是 Earley 算 法 的 一 种 自然 的 优化 。 149 


第 4 章 
上 平 区 相关 分 六 


4.1 概述 


编译 器 的 终极 任务 是 把 输入 程序 翻译 成 能 直接 在 目标 机 器 上 执行 的 形式 。 在 它 把 这 一 输入 程序 翻译 
成 目标 机 器 的 操作 之 前 ， 它 必须 构建 程序 含有 的 基本 信息 。 它 必须 知道 如 何 表示 值 以 及 变量 间 的 值 的 流 
向 。 它 必须 理解 计算 的 结构 。 必 须 分 析 程 序 对 外 部 文档 和 设备 之 间 的 相互 作用 。 所 有 这 些 事实 都 可 以 从 
源 代 码 以 及 某 种 上 下 文 的 信息 中 获取 。 然 而 ， 这 要 求 编译 器 要 做 比 扫描 和 语法 分 析 更 深入 的 调查 。 
考虑 一 个 变量 x。 在 编译 器 生成 涉及 x 的 计算 的 可 执行 目标 机 器 代码 之 前 ， 它 必须 回答 很 多 问题 。 
。 存 储 在 x 中 值 的 类 型 是 什么 ? 现代 程序 设计 语言 使 用 多 种 数据 类 型 ， 包括 若干 类 数 、 字 符 、 布 尔 值 、 
151 指向 其 他 对 象 的 指针 、 文 字 量 、 集 合 (例如 {red，yellow，green}) 以 及 其 他 类 型 。 大 多 数 语言 
包括 聚集 各 种 值 的 复合 对 象 ; 包括 数组 、 结 构 体 、 集 合 和 串 。 
“x* 有 多 大 ? 因为 编译 器 必须 对 x* 进 行 操作 ， 它 需要 知道 x 在 目标 机 器 上 的 表示 的 长 度 。 如 果 x 是 一 个 
数 ， 那 么 它 的 长 度 也 许 是 一 个 字 ( 整数 或 浮 点 数 )、 两 个 字 ( 双 精度 浮 点 数 或 复数 ) 或 四 个 字 (四 
倍 精度 浮 点 数 或 双 精 度 复数 )。 对 于 数组 和 串 ， 元 素 的 数目 可 能 在 编译 时 固定 下 来 ， 也 可 能 在 运行 
时 确定 。 
。 如 果 x 是 一 个 过 程 ， 那 么 它 需 要 什么 样 的 参数 ? 如 果 它 返回 值 ， 那 么 返回 值 的 类 型 是 什么 ? 在 编译 
器 生成 调用 过 程 的 代码 之 前 ， 它 必须 知道 这 个 被 调用 的 过 程 代码 期 望 有 多 少 个 参数 ， 在 哪里 找到 
这 些 参 数 ， 以 及 每 个 参数 的 值 的 类 型 。 如 果 过 程 返回 一 个 值 ， 调 用 这 一 过 程 的 代码 在 哪里 可 以 找 
到 这 个 值 ， 这 个 值 的 类 型 是 什么 ? (编译 器 必须 保证 调用 程序 用 相 容 和 安全 的 方式 使 用 这 个 值 。 
如 果 调 用 程序 假设 返回 值 是 一 个 可 以 解除 引用 的 指针 ， 而 被 调用 过 程 返 回 任意 一 个 字符 串 ， 那 么 
结果 也 许 不 能 预测 、 不 安全 或 不 相 容 。) 
。x 的 值 必须 保存 多 长 时 间 ? 编译 器 必须 保证 x 的 值 能 够 被 所 有 可 以 合法 引用 x 的 计算 的 任意 部 分 所 存 
取 。 如 果 x 是 Pascal 语 言 中 的 一 个 局 部 变量 ， 那 么 编译 器 容易 通过 在 声明 x 的 过 程 的 运行 期 间 保 存 x 
的 值 而 过 多 估算 它 的 生存 期 。 如 果 x 是 在 任意 位 置 都 可 被 引用 的 一 个 全 局 变量 ,或 者 是 由 程序 显 式 
地 分 配 的 结构 体 的 一 个 成 员 ， 那 么 编译 器 可 能 更 难以 决定 它 的 生存 期 。 编 译 器 可 以 总 是 在 整个 计 
算 中 保存 x 的 值 ; 然而 ， 关 于 x 的 生存 期 的 更 精确 的 信息 可 以 使 编译 器 能 够 对 在 生存 期 上 与 x 不 冲突 
的 其 他 值 复 用 x 的 空间 。 ; 
。 谁 负责 分 配 x 的 空间 ? (以 及 是 否 初 始 化 它 ? ) 是 为 x 隐 式 地 分 配 空间 还 是 由 程序 显 式 地 为 它 分 配 
空间 ?如 果 是 显 式 地 分 配 空间 ， 那 么 编译 器 必须 假设 在 程序 运行 之 前 不 知道 x 的 地 址 。 另 一 方面 ， 
152 如 果 编 译 器 是 用 它 管理 的 运行 时 数据 结构 之 一 给 x 分 配 空间 ， 那 么 关于 x 的 地 址 编译 器 知道 的 更 多 。 
这 一 信息 可 能 使 编译 器 生成 更 有 效 的 代码 。 
编译 器 必须 从 源 程序 和 源 程序 的 规则 那里 得 到 这 些 问题 以 及 更 多 问题 的 答案 。 在 类 Algol 语 言 ， 例 如 
Pascal 或 C 语 言 中 ， 这 些 问 题 中 的 大 多 数 可 以 通过 检查 x 的 声明 而 得 到 解答 。 如 果 语 言 没 有 声明 ， 就 像 APL 
语言 ， 编 译 器 必须 通过 分 析 程 序 得 到 这 类 信息 ， 或 者 它 必 须 生成 可 以 处 理 可 能 发 生 的 所 有 情况 的 代码 。 
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树 仅 在 赋值 右 侧 的 ident 的 文本 是 不 同 的。 如 果 x 和 y 是 数 而 z 是 字符 串 ， 那 么 编译 器 也 许 需要 对 x<e-y 产 生 
不 同 于 对 Xx<-z 产 生 的 代码 。 为 了 区 别 这 种 情况 ， 编 译 器 必须 深入 挖 气 源 程序 的 意义 。 扫 描 和 语法 分 析 仅 
处 理 程序 的 形式 ; 意义 的 分 析 是 上 下 文 相 关 分 析 (context-sensitive analysis) 的 范围 。 

为 了 和 弄 清 楚 语 法 与 意义 之 间 的 差异 ， 考 虑 在 多 数 类 Algol 语 言 中 的 程序 结构 。 这 些 语言 要 求 每 个 变 
量 在 被 使 用 之 前 必须 被 声明 ， 而 且 变 量 的 使 用 必须 与 其 声明 一 致 。 

编译 器 设计 者 可 以 构造 确保 所 有 声明 出 现在 可 执行 语句 之 前 的 语法 。 如 下 形式 的 产生 式 确 保 所 有 声 
明 出 现在 可 执行 语句 之 前 : 

ProcedureBody 一 Declarations Executables 


其 中 ， 非 终止 符 有 显然 的 意义 。 这 不 对 更 深 的 规则 进行 检查 ， 也 就 是 说 ， 不 检查 程序 在 可 执行 语句 中 第 
一 次 使 用 每 一 个 变量 之 前 是 否 声 明 它 。 它 也 不 能 处 理 诸如 C++ 语言 这 样 的 简单 情况 ， 这 类 语言 要 求 对 某 
些 范 畴 的 变量 在 使 用 前 先进 行 声明 ， 但 容许 程序 员 穿插 着 书写 声明 和 可 执行 语句 。 

强制 要 求 “ 使 用 前 声明 ”规则 要 求 的 信息 层次 更 高 ， 无 法 使 用 上 下 文 无 关 文法 来 描绘 。 上 下 文 无 关 
文法 处 理 的 是 语法 范畴 而 不 处 理 特定 的 字 。 因 此 ， 文 法 可 以 描述 在 表达 式 中 变量 名 可 能 出 现 的 位 置 ， 而 
且 文 法 可 以 告知 出 现 了 变量 名 。 然 而 ， 文 法 没有 办 法 把 一 个 变量 名 的 一 个 实例 与 另外 一 个 实例 匹配 ， 这 
一 匹配 要 求 文 法 描述 更 深层 的 分 析 ， 要 求 能 够 考 虚 上 下 文 并 能 够 检查 和 处 理 比 上 下 文法 无 关 语 法 更 深层 
信息 的 分 析 。 

本 章 探讨 需要 上 下 文 相 关 分 析 的 若干 问题 ， 并 且 讨 论 执行 上 下 文 相 关 分 析 的 框架 。 本 章 始终 以 类 
型 检查 为 例 来 说 明 上 下 文 相关 分 析 的 必要 性 以 及 在 执行 上 下 文 相关 分 析 时 出 现 的 问题 。4.2 节 对 类 型 系 
统 和 类 型 推理 的 必要 性 做 概括 性 的 介绍 。 为 了 执行 类 型 推理 和 类 似 的 关于 上 下 相关 语法 的 计算 ,我 们 
引入 两 个 框架 : 一 个 是 4.3 节 中 的 属性 文法 形式 ， 另 一 个 是 4.4 节 中 的 语法 制导 翻译 的 一 个 特定 形态 。 高 
级 话题 一 节 概 述 在 类 型 推理 和 类 型 检查 中 导致 更 困难 问题 的 几 种 状况 ， 它 还 给 出 语法 制导 翻译 设计 的 
例子 。 


4.2 类 型 系统 概述 


大 多 数 程序 设计 语言 都 对 每 个 数据 值 关联 一 系列 性 质 。 我 们 称 这 样 的 一 系列 性 质 为 这 个 值 的 类 型 
(type )。 类 型 描述 这 一 类 型 的 所 有 值 共 有 的 一 组 性 质 。 可 以 使 用 成 员 关 系 描述 类 型 ; 例如 ， 一 个 整数 可 
能 是 在 -22<i<23! 范 围 内 的 任意 的 整数 ，red 可 能 是 定义 为 {red，orange，ye11ow，green，blue， 
brown，black，white} 的 枚 举 类 型 colors 中 的 一 个 值 。 可 以 使 用 规则 描述 类 型 ， 例 如 ，C 语 言 中 结构 体 
的 声明 定义 一 个 类 型 。 在 这 里 ， 类 型 包含 在 声明 域 中 按 声明 顺序 排列 的 任意 对 象 ， 各 声明 域 拥有 描述 值 
的 允许 范围 和 它们 的 解释 的 类 型 。( 我 们 把 一 个 结构 体 的 类 型 表示 成 这 一 结构 体 的 组 成 域 的 类 型 的 按 序 
RE.) 某 些 类 型 是 程序 设计 语言 预定 义 的 ; 而 程序 员 构造 其 他 类 型 。 程 序 设计 语言 中 的 类 型 集合 ， 连 
同 使 用 类 型 描述 程序 行为 的 规则 ， 统 称 为 类 型 系统 (type system). 


4.2.1 类 型 系统 的 目的 


程序 设计 语言 设计 者 们 引入 类 型 系统 ， 以 便 能 够 在 比 上 下 文 无 关 文法 更 精确 的 层次 上 描述 程序 的 行 
为 。 类 型 系统 为 描述 合法 程序 的 形式 和 行为 生成 另 一 种 交流 手段 。 根 据 类 型 系统 的 观点 分 析 程 序 可 以 获 
得 使 用 扫描 和 语法 分 析 技术 所 不 能 得 到 的 信息 。 在 编译 器 中 ， 这 一 信息 可 以 用 于 三 个 不 同 的 目的: 安全 
性 、 表 示 能 力 和 运行 时 效率 。 
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1. 确保 运行 时 安全 性 

设计 优良 的 类 型 系统 有 助 于 编译 器 检查 并 避免 运行 时 错误 。 类 型 系统 应 该 确保 程序 有 良好 的 行为 ， 
也 就 是 说 编译 器 和 运行 时 系统 在 执行 一 个 引发 运行 时 错误 的 操作 之 前 可 以 识别 所 有 不 良 程序 。 事 实 上 ， 
类 型 系统 不 能 捕 氟 到 所 有 不 良 程序 ; 不 良 程序 集合 是 不 可 计算 的 。 诸 如 对 一 个 超出 范围 的 指针 解除 引用 
等 的 运行 时 错误 有 显然 的 影响 (并且 通常 是 灾难 性 的 影响 )。 而 诸如 错误 地 把 一 个 整数 解释 成 浮 点 数 等 
的 运行 时 错误 可 能 有 微妙 、 累 积 性 的 影响 。 编 译 器 应 该 使 用 类 型 检测 技术 尽 可 能 多 地 消除 运行 时 错误 。 

为 了 实现 这 一 点 ， 编 译 器 必须 首先 为 每 个 表达 式 推断 它 的 类 型 。 这 些 推断 的 类 型 暴露 出 某 个 值 没 有 
得 到 正确 解释 的 一 些 情况 ， 诸 如 在 布尔 值 的 地 方 使 用 了 浮 点 数 等 。 其 次 ， 编 译 器 必须 参照 定义 语言 的 规 
则 检查 每 一 个 操作 符 的 各 操作 数 的 类 型 是 否 是 语言 所 允许 的 。 在 某 些 情况 下 ， 这 些 规则 也 许 要 求 编译 器 
把 一 个 值 从 一 种 表示 转换 成 男 外 一 种 表示 。 在 其 他 情况 下 ， 这 些 规则 也 许 禁 止 这 样 的 转换 ， 并 仅仅 声明 
程序 是 不 良 程序 ， 因 此 是 不 可 执行 的 。 

在 大 多 数 语言 中 ， 编 译 器 能 够 为 每 一 个 表达 式 推 断 一 个 类 型 。FORTRAN 77 具 有 特别 简单 的 、 只 有 
少数 几 个 类 型 的 类 型 系统 。 图 4-1 给 出 关于 + 操作 符 的 所 有 情况 。 给 定 表达 式 atb 和 a 与 bp 的 类 型 ， 图 4-1 的 
表格 描述 atb 的 类 型 。 对 于 一 个 整数 a 和 一 个 双 精 度数 b，atb 产 生 一 个 双 精 度 结果 


+ x ”型 实 型 RHE 复 数 


integer integer real double Comp1ex 


real real real double complex 
double double double double 不 合法 
complex comp] ex complex 不 合法 complex 





图 4-1 FORTRAN 77 中 + 运算 的 结果 类 型 


相反 ， 如 果 a 是 一 个 复数 ， 那 么 afb 将 是 不 合法 的 。 编 译 器 应 该 检查 这 一 情况 并 在 程序 执行 前 报告 这 
一 错误 ， 这 就 是 一 个 简单 的 类 型 安全 性 的 例子 。 

对 于 某 些 语言 ， 编 译 器 不 能 对 所 有 的 表达 式 推断 其 类 型 。 例 如 ，APL 没 有 声明 ， 它 允 许 变量 在 任意 
赋值 中 改变 类 型 ， 而 且 容 许 用 户 在 输入 提示 下 键入 任意 代码 。 虽 然 这 些许 可 使 得 APL 的 功能 和 表示 能 力 
都 很 强大 ， 但 是 我 们 需要 它 的 实现 必须 做 一 定量 的 运行 时 类 型 推理 和 检测 。 

安全 性 是 使 用 类 型 语言 的 一 个 重要 原因 。 在 程序 执行 之 前 捕 提 大 多 数 类 型 相关 的 错误 可 以 简化 程序 
的 设计 和 实现 。 可 以 对 每 一 个 表达 式 指 定 一 个 非 歧 义 类 型 的 语言 称 为 强 类 型 语言 (strongly typed 
language)。 可 以 在 编译 时 对 每 一 个 表达 式 指定 类 型 的 语言 称 为 静态 类 型 语言 (statically typed language). 
只 能 在 运行 时 才能 对 某 些 表达 式 指 定 类 型 的 语言 称 为 动态 类 型 语言 (dynamically typed language)。 还 有 
另外 两 种 语言 : 无 类 型 (untyped) 语言 ， 如 汇编 语言 或 BCPL， 以 及 弱 类 型 (weakly typed) 语言 ， 这 
一 语言 带 用 一 个 微弱 的 类 型 系统 。 

2. 改进 表示 能 力 

一 个 结构 良好 的 类 型 系统 使 得 语言 设计 者 得 以 比 上 下 文 无 关 文 法 规则 更 精确 地 描述 程序 的 行为 。 这 
种 能 力 让 语言 设计 者 加 入 用 上 下 文 运 无 关 文 法 不 能 描述 的 一 些 特征 ,一 个 非常 好 的 例子 就 是 操作 符 重 载 ， 
它 对 操作 符 赋予 上 下 文 相关 的 意义 。 很 多 程序 设计 语言 使 用 + 表示 几 种 加 法 。+ 的 解释 依赖 于 它 的 操作 
数 的 类 型 。 在 类 型 语言 中 ， 很 多 操作 符 被 重 载 。 而 隐 式 类 型 语言 则 是 对 每 一 种 情况 提供 词法 上 不 同 的 操 


O 当然 ， 这 种 选择 假设 程序 行为 良好 且 忽视 这 样 的 检测 。 通 常 当 程序 出 错时 ， 这 导致 不 良 的 行为 。 在 APL 中 ， 
很 多 性 能 的 改善 高 度 取决 于 类 型 的 有 效 性 以 及 维 数 信息 。 
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作 符 。 | 
例如 ， 在 BCPL 中 ， 惟 一 的 类 型 是 “单元 "。 一 个 单元 可 以 存放 任意 的 位 模式 ; 这 一 位 模式 的 解释 由 
作用 于 该 单元 的 操作 符 决定 。 因 为 单元 本 质 上 是 无 类 型 的 ,操作 符 不 可 被 重 载 。 因 此 ，BCPL 对 整数 加 
法 使 用 + 而 对 浮 点 加 法 使 用 #+。 给 定 两 个 单元 a 和 b，a+b 和 a#+b 都 是 合法 的 表达 式 ， 它 们 都 不 对 其 操作 
数 执行 任意 转换 。 

相反 ， 即 使 是 最 古老 的 类 型 语言 也 都 使 用 重 载 来 描述 复杂 的 行为 。 正 如 前 面 一 节 所 述 ，FORTRAN 
有 一 个 加 法 操作 符 +， 它 使 用 类 型 信息 决定 这 一 类 型 的 实现 。ANSI C 使 用 函数 原型 ， 即 函数 参数 的 数目 
及 其 类 型 和 函数 的 返回 值 类 型 的 声明 来 把 参数 转换 成 适当 的 类 型 。 类 型 信息 决定 C 语 言 中 自 增 指针 的 效 
应 ; 指针 的 类 型 决定 增加 量 。 面 向 对 象 语 言 对 每 一 次 过 程 调用 使 用 类 型 信息 选择 适当 的 实现 。 例 如 ， 
Java 语 言 通 过 检查 构造 器 的 参数 列表 在 默认 构造 器 和 特定 构造 器 之 间 做 出 选择 。 

3. 生成 更 好 的 代码 

一 个 设计 良好 的 类 型 系统 为 编译 器 提供 程序 中 每 一 个 表达 式 的 详细 信息 ， 也 就 是 可 以 用 于 生成 更 高 
效 翻 译 的 信息 。 考 虑 在 FORTRAN 77 中 实现 加 法 。 编 译 器 可 以 完全 决定 所 有 表达 式 的 类 型 ， 所 以 它 可 以 
参考 类 似 于 图 4-2 所 示 的 表格 。 右 侧 的 代码 显示 加 法 的 ILOC 操 作 ， 连 同 对 于 混合 类 型 表达 式 用 
FORTRAN 标 准 所 描述 的 转换 代码 。 整 个 表格 包括 图 4-1 的 所 有 情况 。 


Type of K WB 
a 的 类 型 ”b 的 类 型 ”a+b 的 类 型 
integer integer integer iADD ras ro = Tato 
integer real real i2f ra => rap 
FADD raps Th => raf+b 
integer double double i2d ra => Ta, 
dADD Tage To = ragtb 


real real real FADD ras Th = Tab 


real double double red ry => rad 


dADD Tags Th => ragtb 


double double double dADD ra, Th = ra+b 





图 4-2 FORTRAN 77 中 的 加 法 的 实现 


在 编译 时 不 能 决定 所 有 类 型 的 语言 中 ， 类 型 检查 的 某 些 部 分 可 能 要 推迟 到 执行 时 进行 。 为 了 完成 这 
一 工作 ， 编 译 器 有 必要 发 行 类 似 于 图 4-3 所 示 伪 码 的 代码 。 

(这 一 代码 给 出 与 图 4-2 所 示 的 各 情况 相同 的 子 集 。 ) 虽然 这 保证 运行 时 的 安全 ， 它 却 大 幅度 增加 每 
一 个 操作 的 系统 开销 。 编 译 时 检测 的 一 个 目标 就 是 在 提供 这 样 的 安全 性 的 同时 在 运行 时 不 花费 代价 。 

”图 4-3 中 的 代码 取决 于 运行 代码 可 以 决定 操作 数 a 和 b 的 类 型 这 一 隐 含 的 假设 。 为 了 实现 这 一 点 ， 编 
译 器 和 运行 时 系统 必须 为 每 一 个 值 标 上 它 的 类 型 ， 从 而 使 得 type of a 成 为 对 与 存储 a 的 真实 值 存放 在 一 
起 的 一 个 值 的 引用 。 在 这 个 操作 数 被 转换 之 后 ， 这 一 代码 还 必须 为 结果 值 设置 标签 域 。( 我 们 在 图 4-3 中 
省 略 了 标签 操作 的 代码 。 ) 标签 操作 带 来 的 系统 开销 与 加 法 的 成 本 相 比 是 相当 大 的 。 每 一 个 操作 都 通过 
两 个 case 选 择 语 句 。 连 同 执行 真实 的 加 法 一 起 ， 所 选 情况 的 代码 执行 所 有 必要 的 转换 。 这 一 代码 读 取 两 
个 标签 写 第 三 个 标签 。 如 果 a 和 b 储 存 于 寄存 器 内 ， 那 么 它们 的 标签 应 该 也 在 寄存 器 内 。 这 减 小 标签 存 取 
的 代价 ， 但 却 增加 对 寄存 器 的 需求 。( 另 一 个 选择 是 以 a 和 b 的 空间 的 一 部 分 为 标签 存储 空间 ， 并 减 小 它 
们 所 能 表示 的 值 的 范围 , ) 
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switch (type of a) { 
case integer: 


PAF 





switch ( type of b ) { 


case integer: 


case real: 
case double: 
default: 


} 
break 
case real: 


HADD raso > ra+b 
break 


.12f ra => Tas 


FADD raf re > raf+b 
break 

i2d ra => Tad 

GADD rad smb > Tad+b 
break 

signal a run-time type error 
break 


switch (type of b) { 


case integer: 


case real: 


case double: 
default: 


} 
break 
case double: 


i2f mb => mbf 

fADD masrbf = Ta+bd 
break 

fADD ravrb => Vas 

break 

f2d ra > Yay 

GADD rayso => Tad+b 
break 

signal a run-time type error 
break 


switch ( type of b ) { 


case integer: i2d rẹ, > r» d 


case real: 


case double: 
default: 

} 

break 


dADD TasTby = ra+bd 
break 

fad rn, = r» d 

dADD Tas, => Ta+bd 
break 

dADD Taso = Tatb 

break 

signal a run-time type error 


default: signal a run-time type error 


break 





图 4-3 使 用 FORTRAN 77 规 则 对 + 执行 运行 时 检测 和 转换 


编译 时 执行 类 型 推断 和 检测 消除 这 种 系统 开销 。 它 可 以 使 用 图 4-2 所 示 的 更 快 、 更 紧凑 的 代码 取代 
图 4-3 的 控制 流 和 测试 。 在 一 般 情 况 下 ， 这 些 操作 是 不 可 避免 的 。( 额外 的 信息 可 以 进一步 简化 这 一 代码 。 
例如 ， 如 果 编 译 器 知道 加 法 的 一 个 操作 数 是 零 ， 那 么 它 就 可 以 消除 这 一 加 法 。) 


4. 类 型 检测 


为 了 获得 这 些 益 处 ， 编 译 器 必须 分 析 程 序 并 为 每 一 个 表达 式 赋予 它 所 计算 的 类 型 。 它 必须 检测 这 些 


类 型 以 保证 这 些 类 型 用 在 使 它们 合法 的 上 下 文中 。 


这 些 活 动 通常 统称 为 类 型 检测 (type checking). XH 


一 个 不 恰当 的 名 称 ， 因 为 把 赋值 、 推 断 、 类 型 以 及 类 型 相关 错误 的 检测 这 些 不 同 的 活动 混在 了 一 起 。 
程序 员 应 该 知道 类 型 检测 的 执行 方式 。 一 个 强 类 型 、 静 态 可 检测 语言 也 许 是 使 用 动态 检测 来 实现 的 
(或 者 甚至 完全 不 做 检测 )。 一 个 无 类 型 语言 可 以 用 捕捉 某 种 错误 的 方式 实现 。ML 和 Modula-3 都 是 可 以 
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使 用 静态 检测 的 强 类 型 语言 的 好 例子 。Common Lisp 拥 有 必须 使 用 动态 检测 的 强 类 型 系统 。ANSI C 是 类 
型 语言 ， 但 它 的 实现 通常 对 违反 类 型 做 非常 弱 的 检测 。 

类 型 系统 的 理论 包括 大 而 复杂 的 信息 体系 。 本 节 对 类 型 体系 给 出 一 个 总 体 的 认识 ， 并 引入 检测 中 的 
一 些 简单 问题 。 后 续 各 节 把 类 型 推断 的 简单 问题 作为 上 下 文 相关 计 算 的 一 个 例子 。 


4.2.2 类 型 系统 的 组 成 部 分 


典型 的 现代 语言 的 类 型 系统 有 四 个 主要 组 成 成 份 : 一 组 基本 类 型 ， 即 内 建 类 型 ; 从 现存 类 型 构造 新 
类 型 的 规则 ; 决定 两 个 类 型 是 否 等 价 或 相 容 的 方法 ;以 及 推断 每 一 个 源 语 言 表 达 式 的 类 型 的 规则 。 很 多 
语言 还 包括 基于 上 下 文 将 值 从 一 个 类 型 隐 式 地 转换 到 另外 一 个 类 型 的 规则 。 本 节 较 详细 地 描述 这 四 个 组 
成 部 分 ， 同 时 给 出 流行 的 程序 设计 语言 的 例子 。 

1. 基本 类 型 

绝 大 多 数 程 序 设计 语言 或 多 或 少 包含 下 列 基 本 类 型 : 数 、 字 符 和 布尔 值 。 这 些 类 型 得 到 大 多 数 处 理 
器 的 直接 支持 。 通 常 ， 数 类 型 以 若干 种 形式 出 现 ， 例 如 整数 类 型 和 浮 点 数 类 型 。 有 些 语言 加 入 其 他 基本 
类 型 。Lisp 即 包含 有 理 数 类 型 ， 还 包含 递归 列表 类 型 。 有 理 数 本 质 上 是 解释 成 比 的 整数 对 。 列 表 定 义 为 
或 者 是 特殊 的 ni1 ， 或 者 是 序 对 〈f，r)， 其 中 f 是 对 象 而 r 是 列表 。 

这 些 基 本 类 型 的 精确 定义 以 及 为 它们 所 定义 的 操作 符 因 语 言 不 同 而 不 同 。 一 些 语言 细 化 这 些 基 本 类 
型 以 创造 出 更 多 的 类 型 ; 例如 ， 很 多 语言 在 它们 的 类 型 系统 中 区 分 若干 种 数 的 类 型 。 而 其 他 语言 则 缺少 
一 个 或 多 个 这 样 的 基本 类 型 ; 例如 ，C 缺 少 字符 串 类 型 。 取 而 代 之 ，C 语 言 把 字符 串 实 现成 字符 数组 的 
指针 。 几 乎 所 有 语言 都 包含 从 基本 类 型 构造 更 复杂 类 型 的 装置 。 

(1) 数 

几乎 所 有 程序 设计 语言 都 包含 一 种 或 多 种 数 作为 基本 类 型 。 典 型 地 ， 这 包括 对 有 限 区 域 的 整数 和 通 
常 称 为 浮 点 〈floating-point) 数 的 近似 实数 。 很 多 程序 设计 语言 通过 为 不 同 的 硬件 实现 创建 不 同 的 类 型 
以 揭示 相关 的 硬件 实现 。 例 如 ，C、C++ 和 Java 区 分 带 符号 整数 和 无 符号 整数 。 

FORTRAN、PL/1、Ada 和 C 规 定 整 数 的 长 度 。 在 PL/I 中 ， 程 序 员 使 用 位 来 描述 长 度 ; 然后 ， 编 译 器 
把 这 一 长 度 映射 到 整数 的 硬件 表示 上 。PL/I 的 IBM 370 实 现 把 fixed binary(15) 变量 映射 到 16 位 整数 ， 
而 把 fixed binary(31) 映射 到 32 位 整数 。 相 反 ，C 语 言 和 FORTRAN 使 用 相对 术语 描述 长 度 。C 语 言 的 
1ong 的 长 度 是 short 的 长 度 的 两 倍 。 同 样 的 关系 对 FORTRAN 中 的 doub1e 和 real1 也 成 立 。 然 而 ， 这 两 种 
语言 的 定义 都 把 从 长 度 描述 到 特定 位 长 度 的 映射 留 给 编译 器 。 

某 些 语言 详细 地 描述 实现 。 例 如 ，Java 为 长 度 为 8、16、32 和 64 位 的 带 符 号 整数 定义 不 同 的 类 型 。 
这 些 类 型 分 别 是 byte、short、int 和 1ong。 同 样 地 ，Java 的 f1oat 类 型 描述 32 位 IEEE 浮 点 数 ， 而 它 的 
double 类 型 描述 64 位 IEEE 浮 点 数 。 这 种 方法 保证 程序 在 不 同 的 体系 结构 上 有 相同 的 行为 。 

Scheme 采 用 不 同 的 方式 。 这 一 语言 的 定义 包含 一 个 分 层 数 类 型 , 但 让 实现 者 选择 支持 的 子 集 。 然 而 ， 
它 的 标准 在 精确 数 和 非 精 确 数 之 间 画 上 一 条 严格 的 界线 ， 并 且 规 定 某 些 操作 在 所 有 参数 都 是 精确 数 时 必 
须 返 回 一 个 精确 数 。 从 而 为 实现 者 提供 一 定 程度 的 自由 度 ， 同 时 又 允许 程序 员 推断 什么 时 候 在 什么 地 方 
可 以 出 现 近 似 的 情况 。 

(2) 字符 

很 多 语言 包含 字符 类 型 。 抽 象 地 说 ， 一 个 字符 是 一 个 单一 字母 。 多 年 来 ， 由 于 受到 西方 字母 表 的 限 
制 ， 这 导致 使 用 单一 字 节 (8 位 ) 表示 字符 ， 通 常 被 映射 到 ASCII 字 符 集 (或 在 IBM 机 器 上 的 EBCDIC 字 
WE.) 最 近 ， 更 多 的 实现 ， 包 括 操作 系统 和 程序 设计 语言 都 已 开始 支持 由 Unicode 标 准 形式 表示 的 更 大 
字符 集 ， 这 样 的 字符 需要 16 位 。 大 多 数 语言 都 假设 字符 集 是 有 序 的 ， 这 样 ， 标 准 的 比较 操作 符 ， 如 <、 
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= 和 > 可 以 按 字母 顺序 直观 地 进行 工作 。 只 有 少数 其 他 操作 在 字符 数据 上 有 意义 。 

(3) 布尔 类 型 

大 多 数 程序 设计 语言 包含 取 两 个 值 true 和 fa1se 的 布尔 类 型 。 布 尔 类 型 值 的 标准 操作 包括 and、or、 
xor 和 not。 布 尔 值 或 布尔 值 表达 式 通 常用 于 决定 控制 流 。C 把 布尔 值 认 为 是 无 符号 整数 的 子 区 间 ， 取 值 
限定 于 0 ( 假 ) 和 1 (F). 


2. 合成 类 型 和 结构 类 型 

虽然 程序 设计 语言 的 基本 类 型 通常 为 直接 受 控 于 硬件 的 实际 数据 提供 充分 的 抽象 ， 但 是 作为 表示 程 
序 所 需 的 信息 的 符号 ， 通 常 它们 是 不 够 的 。 程 序 经 常 要 处 理 更 复杂 的 数据 结构 ， 如 图 、 树 、 表 格 、 数 组 、 
列表 以 及 栈 。 这 些 结 构 包 含 一 个 或 多 个 对 象 ， 每 个 对 象 带 有 自身 的 类 型 。 为 这 些 合成 对 象 或 聚合 对 象 构 
造 新 类 型 的 能 力 是 很 多 程序 设计 语言 的 本 质 特征 。 这 一 能 力 使 程序 员 以 新 颖 、 程 序 特有 的 方式 组 织 信息 。 
把 这 些 组 织 与 类 型 系统 结合 增加 编译 器 检测 不 良 程序 的 能 力 。 它 也 使 语言 可 以 表示 高 级 操作 ， 如 对 整个 
结构 的 赋值 。 

以 Lisp 为 例 ， 这 一 语言 为 程序 设计 提供 列表 的 广泛 支持 。Lisp 的 列表 是 结构 类 型 。 一 个 列表 或 者 是 
一 个 特殊 值 ni 1 或 者 是 (consfr ) ， 其 中 f 是 一 个 对 象 ，r 是 一 个 列表 ， 而 cons 是 通过 它 的 两 个 参数 生成 一 
个 列表 的 构造 器 。Lisp 的 实现 可 以 检查 每 一 个 cons 调 用 以 保证 它 的 第 二 个 参数 是 一 个 列表 。 

(1) 数组 

数组 是 最 常见 的 聚合 对 象 。 数 组 把 相同 类 型 的 多 个 对 象 组 合 起 来 ， 并 给 每 一 个 对 象 一 个 不 同 的 名 字 : 
虽然 是 隐 式 而 非 显 式 地 、 由 程序 员 设 计 的 名 字 。C 的 声明 语句 int a[100][200]; 设置 20 000 个 整数 的 空 
间 ， 并 且 保 证 可 以 使 用 名 字 a 对 这 些 整数 寻 址 。 引 用 a[1]517] 和 a[2][30] 存 取 不 同 且 独立 的 内 存单 元 。 | 
数组 的 本 质 性 质 是 程序 可 以 通过 使 用 数 ( 或 其 他 有 序 ， 离 散 类 型 ) 来 计算 每 一 个 元 素 的 名 字 。 

不 同 的 语言 对 数组 的 操作 的 支持 有 巨大 的 差异 。FORTRAN 90、PL/I 和 APL 都 支持 对 整个 或 部 分 数 
组 的 赋值 。 这 些 语言 支持 同时 作用 于 数组 各 元 素 的 操作 。 对 于 10 x 10 的 数组 Xx、y 和 z， 语 句 x=y+z 使 用 y 
和 z 的 相应 元 素 的 和 重 写 x 的 每 一 个 元 素 。APL 比 其 他 大 多 数 语言 在 这 一 点 上 更 先进 ; 它 包 含 内 积 、 外 积 
和 若干 种 总 括 操 作 的 操作 符 。(x 的 总 括 和 ， 记 作 +/x， 计 算 x 的 所 有 元 素 的 和 。 ) 

数组 可 以 看 成 是 结构 类 型 ， 因 为 我 们 通过 描述 数组 元 素 的 类 型 来 构造 它 。 因 此 ， 一 个 10 x 10 的 整数 
数组 是 具有 类 型 整数 的 二 维 数组 (two-dimensional array of integers )。 一 些 语言 在 数组 的 类 型 中 包含 它 
的 维 数 ; 因此， 一 个 10 x 10 的 整数 数组 与 一 个 12 x 12 的 整数 数组 有 不 同 的 类 型 。 这 使 得 编译 器 作为 类 型 
错误 捕捉 维 数 不 一 致 的 数组 操作 。 大 多 数 语言 允许 任意 基本 类 型 的 数组 ; 而 有 些 语言 还 人 允许 结构 类 型 的 
数组 。 

(2) 串 

一 些 程序 设计 语言 把 串 看 成 是 结构 类 型 。 例 如 ，PL/I 即 有 位 串 又 有 字符 串 。 对 于 这 两 种 类 型 所 定义 
的 各 种 性 质 、 属 性 和 操作 都 是 相似 的 ; 它们 都 具有 串 的 性 质 。 位 串 与 字符 串 在 各 位 置 上 所 允许 的 值 的 
HAR. Abb, HENS Ra (string of bit) 和 字符 串 (string of character) BAIN. (KBR 
支持 串 的 语言 局 限于 支持 单一 的 串 类 型 ， 也 就 是 字符 串 。) 其 他 语言 通过 把 字符 串 当 作 字 符 数组 来 支持 
字符 串 。 

真正 的 串 类 型 与 数组 类 型 在 若干 重要 方面 是 不 同 的 。 在 串 上 有 意义 的 操作 ， 如 联结 、 转 换 和 长 度 计 
算 等 操作 对 数组 来 说 也 许 没 有 相应 的 操作 。 从 概念 上 说 ， 串 比较 应 该 按照 字典 顺序 进行 ,因此 有 “a”< 
“boo” 及 “fee”<“fie”。 可 以 按 自然 的 方式 重 载 并 使 用 标准 比较 操作 符 。 字 符 数组 的 比较 类 似 于 数 的 
数组 或 结构 数组 的 相应 比较 ， 可 能 不 同 于 串 的 比较 。 同 样 地 ， 串 的 实际 长 度 可 能 不 同 于 分 配给 它 的 大 小 ， 
而 数组 的 大 多 数 使 用 都 是 使 用 所 有 分 配 的 元 素 。 
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(3) 枚 举 类 型 

很 多 语言 允许 程序 员 创 建 包含 一 组 特定 常量 值 的 类 型 。 这 一 概念 是 在 Pascal 语 言 引入 的 ， 它 允许 程 
序 员 使 用 有 意义 的 名 字 来 记述 一 小 组 常量 。 典 型 例子 包括 一 周 中 的 日 子 和 月 份 。 使 用 C 语 言 的 语法 ， 这 
些 可 能 是 : 


enum WeekDay {Monday, Tuesday, Wednesday, 
Thursday, Friday, Saturday, Sunday}; 


enum Month {January, February, March, April, 
May, June, July, August, September, 
October, November, December}; 


编译 器 把 枚 举 类 型 中 的 每 一 个 元 素 映 射 到 不 同 的 值 。 枚 举 类 型 的 元 素 是 有 序 的 ， 所 以 同类 型 的 元 素 之 间 
的 比较 是 有 意义 的 。 在 上 述 例子 中 ，Monday<Tuesday 及 June<July 都 有 意义 。 不 同 枚 举 类 型 间 的 操作 没 
有 意义 ， 例 如 Tuesday>September 将 产生 一 个 类 型 错误 。Pascal 保 证 每 一 个 枚 举 类 型 的 行为 同 整数 的 某 
个 子 区域 一 样 。 例 如 ， 程 序 员 可 以 声明 以 枚 举 类 型 的 元 素 为 下 标的 数组 。 


结构 的 另 一 种 观 点 


对 于 结构 的 典型 观点 是 把 不 同 的 结构 体 看 成 是 不 同 的 类 型 。 结 构 类 型 的 这 一 方式 与 其 他 聚合 类 | 
型 ， 例 如 数组 和 串 的 处 理 方式 一 致 。 这 似乎 很 自然 ， 对 于 程序 员 来 说 这 样 的 区 分 很 有 用 。 例 如 ， 一 
个 带 有 两 个 子 结 点 的 树 结 点 可 能 应 该 与 带 有 三 个 子 结 点 的 树 结 点 有 不 同 的 类 型 ; 大 概 它们 被 用 于 不 
同 的 情况 。 把 带 有 三 个 子 结 点 的 结 点 赋值 给 带 有 两 个 子 结 点 的 结 点 的 程序 应 该 对 程序 员 生 成 一 个 类 | 
型 错误 和 一 个 警告 信息 。 


然而 ， 从 运行 时 系统 的 角度 看 ， 把 每 一 个 结构 看 成 不 同 的 类 型 使 描述 复杂 化 。 对 于 不 同 的 结构 
类 型 ， 堆 包含 来 自 于 任意 一 组 类 型 的 任意 一 组 对 象 。 这 使 我 们 难以 对 诸如 垃圾 回收 器 等 直接 处 理 堆 
对 象 的 程序 进行 推断 。 为 了 简化 这 样 的 程序 ， 它 们 的 作者 有 时 对 结构 类 型 采用 不 同 的 处 理 方式 。 

这 另 一 种 模型 把 程序 中 所 有 的 结构 考虑 成 单一 类 型 。 各 个 结构 声明 各 自 创建 类 型 strucrare 的 一 | 
个 变形 。 类 型 structure 本 身 是 所 有 这 些 变 形 的 并 集 。 这 一 方式 使 程序 把 堆 看 成 单一 类 型 的 一 组 对 象 ，| 
而 不 是 很 多 类 型 的 一 组 对 象 。 这 使 得 操作 堆 的 代码 更 容易 分 析 和 优化 。 


(4) 结构 和 变量 
结构 把 任意 类 型 的 多 个 对 象 组 合 到 一 起 。 结 构 的 元 素 ， 或 成 员 通常 被 显 式 地 命名 。 例 如 ， 在 C 语 言 
中 实现 分 析 树 可 能 需要 带 有 一 个 或 两 个 子 结 点 的 结 点 。 


struct Nodel { struct Node2 { 
struct Nodel *left; struct Node2 *left; 
unsigned Operator; struct Node2 *right; 
int Value unsigned Operator; 
} 、 int Value 
} 


结构 的 类 型 是 它 的 元 素 的 类 型 的 有 序 积 。 因 此 ， 我 们 可 以 把 类 型 Node1 描 述 成 (Node1 *) x 
unsigned x int ， 而 将 Node2 描 述 成 (Node2 *) x (Node2 *) xunsigned x int。 这 些 新 类 型 具有 与 基本 
类 型 同样 的 基本 性 质 。 将 指针 通过 自动 增加 指向 Node1 和 通过 类 型 转换 指向 Node1 * 时 的 效果 相同 ， 它 们 
的 行为 与 基本 类 型 的 行为 类 似 。 

很 多 程序 设计 语言 允许 创建 作为 多 个 类 型 的 联合 的 类 型 。 例 如 ， 某 个 变量 x 可 以 有 类 型 integer 或 
boo1ean 或 WeekDay。Pascal 语 言 使 用 可 变 记录 来 实现 这 一 点 。 记 录 (record) 是 Pascal 语 言 称呼 结构 的 术 
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语 。C 语 言 则 使 用 union 来 实现 这 一 点 。union 类 型 是 它 的 成 份 类 型 的 并 ; 因此 ， 我 们 的 变量 x 有 类 型 
integer U boolean UWeekDay。 联 合 也 可 以 包含 不 同类 型 的 结构 ， 各 个 类 型 的 长 度 也 可 以 不 同 。 语 言 
须 提供 对 每 一 个 域 进行 非 坡 勾引 用 的 机 制 。 

(5) 指针 

为 使 程序 员 操 作 任 意 的 数据 结构 ， 很 多 语言 都 提供 指针 类 型 。 指 针 抽 象 地 址 。 指 针 允 许 程 序 保存 地 
址 并 在 其 后 检查 存放 于 该 地 址 中 的 对 象 。 当 对 象 被 创建 时 我 们 创建 指针 。( 在 Java 语 言 中 用 new 来 创建 对 
象 ， 在 C 语 言 中 用 ma11oc 来 创建 对 象 . ) 一 些 语言 还 包含 返回 对 象 的 地 址 的 操作 符 ， 例 如 C 的 & 操 作 符 。 
( 当 寻 址 操作 符 被 用 于 一 个 类 型 的 对 象 时 ， 它 返回 指向 类 型 为 的 指针 的 值 。) 

为 了 保护 程序 员 远离 某 些 与 指针 相关 的 错误 ， 例 如 使 用 类 型 的 指针 引用 类 型 "的 结构 ， 一 些 程序 设 
计 话 言 将 指针 赋值 限定 在 “等 价 ” 类 型 的 范围 。 在 这 些 语言 中 ， 赋 值 左 边 的 指针 必须 与 赋值 右边 的 表达 
式 有 相同 的 类 型 。 程 序 可 以 合法 地 把 指向 整数 的 指针 (pointer to integer) 赋 给 声明 为 指向 整数 的 指针 变 
E, 但 是 却 不 能 赋 给 声明 为 指向 整数 指针 的 指针 (pointer to pointer to integer) 变量 或 布尔 指针 
(pointer to boolean) 变量 。 

当然 ， 创 建新 对 象 的 机 制 应 该 返回 相应 类 型 的 对 象 。 因 此 ，Java 语 言 的 new 明 确 地 创建 一 个 具有 类 
型 的 对 象 ; 其 他 语言 使 用 以 返回 类 型 为 参数 的 多 态 过 程 。ANSI C 采 用 一 种 与 众 不 同 的 方法 处 理 这 一 问 
题 ; 标准 的 分 配 过 程 mna110c 返 回 一 个 指向 void 的 指针 。 这 迫使 程序 员 对 ma11oc 的 每 一 次 调用 返回 的 值 
进行 类 型 转换 。 

一 些 语 言 允 许 更 复杂 的 指针 操作 。 指 针 上 的 算术 ， 包 括 自 增 指针 和 自 减 指针 允许 程序 构建 新 指针 。 
C 语 言 使 用 指针 的 类 型 来 决定 增加 或 减 小 的 幅度 。 程 序 员 可 以 把 一 个 指针 设置 为 一 个 数组 的 开始 ; 自 增 
指针 使 其 从 数组 的 一 个 元 素 指向 下 一 个 元 素 。 

指针 类 型 的 安全 性 取决 于 一 个 隐 式 的 假设 : 地 址 对 应 于 具有 类 型 的 对 象 。 创 建新 指针 的 能 力 使 得 这 
一 假设 变 得 有 些 含糊 不 清 ， 而 且 严 重 降低 了 编译 器 和 运行 时 系统 对 基于 指针 的 计算 进行 推理 的 能 力 。 
(参见 8.3 节 的 例子 )。 


3. 类 型 等 价 
任何 类 型 系统 的 重要 组 成 部 分 都 是 它 用 于 决定 两 个 不 同 的 类 型 声明 是 否 等 价 的 机 制 。 考 虑 下 面 的 C 
语言 的 两 个 声明 : 


struct TreeNode { struct SearchTree { 
struct TreeNode *left; struct SearchTree *left; 
struct TreeNode *right; struct SearchTree *right; 
int value int value 


} } 
TreeNode 和 SearchTree 是 一 样 的 类 型 吗 ? 它们 等 价 吗 ? 县 有 非 平凡 类 型 系统 的 任意 程序 设计 语言 必须 
包含 对 于 所 有 类 型 回答 这 一 问题 的 明确 规则 。 

历史 上 ， 有 两 个 一 般 方 法 。 第 一 个 方法 是 名 字 等 价 (name equivalence ) ， 它 主张 两 个 类 型 等 价 当 且 
仅 当 它 们 有 相同 的 名 字 。 MEE AER 这 一 规则 主张 程序 员 可 以 为 一 个 类 型 选择 任意 的 名 字 ; 如 果 
程序 员 选 择 不 同 的 名 字 ， 语 言及 其 实现 应 该 尊重 这 种 有 意 的 行为。 遗憾 的 是 ， 一 旦 一 个 程序 有 多 个 作者 
或 多 个 文件 ， 维 护 名 字 的 一 致 性 实际 上 是 不 可 行 的 。 

第 二 个 方法 是 结构 等 价 (structural equivalence)， 它 主张 两 个 类 型 等 价 当 且 仅 当 它们 有 相同 的 结构 。 
从 哲学 的 角度 看 ， 这 一 规则 主张 如 果 两 个 对 象 以 相同 的 顺序 组 成 相同 的 域 集合 ， 并 且 这 些 域 都 有 等 价 的 
类 型 ， 那 么 这 两 个 对 象 可 以 互 换 。 结 构 等 价 检 查 定 义 这 一 类 型 的 本 质 性 质 。 

这 两 个 策略 都 有 其 优点 和 缺点 。 名 字 等 价 假定 相同 的 名 字 是 有 意 的 行为 ; 在 大 型 程序 设计 项 目 中 ， 
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这 要 求 程序 回避 无 意识 的 冲突 。 结 构 等 价 假定 可 交换 对 象 可 以 安全 地 相互 用 于 另 一 对 象 ; 如 果 某 些 值 
有 “特殊 ”的 意义 ， 那 么 这 可 能 引发 问题 。( 想像 两 个 假定 的 结构 相同 的 类 型 。 第 一 个 类 型 有 一 个 系 
统 VO 控 制 块 ， 而 第 二 个 类 型 有 一 组 屏幕 位 映射 图 像 的 信息 。 把 它们 当 作 两 个 不 同 的 类 型 使 得 编译 器 能 
够 检查 到 一 个 错误 ， 即 将 VO 控制 用 于 屏幕 更 新 过 程 的 错误 ， 而 把 它们 当 作 相 同类 型 时 则 不 会 发 生 这 个 
错误 。) 

4. 类 型 推断 规则 

通常 对 每 一 个 操作 符 ， 类 型 推断 规则 描述 操作 数 类 型 与 结果 类 型 之 间 的 映射 。 对 于 某 些 情况 ， 这 一 
映射 很 简单 。 例 如 ， 赋 值 有 一 个 操作 数 和 一 个 结果 。 这 一 结果 ， 或 称 左 部 必须 有 与 操作 数 或 右 部 类 型 相 
容 的 类 型 。( 在 Pascal 中 ， 区 间 1..100 与 整数 是 相 容 的 ， 因 为 这 一 区 间 的 任意 元 素 都 可 以 安全 地 被 赋值 给 
一 个 整 型 变量 , ) 这 一 规则 允许 将 整数 值 赋值 给 整 型 变量 。 它 禁止 将 结构 赋值 给 整 型 变量 ， 除 非 明 确 地 
进行 有 意义 的 类 型 转换 。 

操作 数 类 型 与 结果 类 型 之 间 的 关系 通常 描述 成 表达 式 树 的 类 型 上 的 递归 函数 。 作 为 这 一 操作 的 操作 
数 的 类 型 的 函数 ， 这 一 函数 计算 操作 的 结果 类 型 。 这 一 函数 可 能 描述 成 表格 形式 ， 类 似 于 图 4-1 中 的 表 
格 。 有 了 时候， 操作 数 类 型 与 结果 类 型 之 间 的 关系 可 以 用 简单 的 规则 描述 。 例 如 在 Java 语 言 中 ， 把 不 同 精 
度 的 两 个 整数 类 型 加 起 来 产生 一 个 较 精确 ( 较 长 ) 类 型 的 结果 。 

类 型 推断 规则 可 以 识别 类 型 错误 。 在 FORTRAN 表 格 中 ， 某 些 组 合 是 被 禁止 的 ， 例 如 doub1e 与 
comp1ex 的 组 合 。 这 一 组 合 产生 一 个 类 型 错误 ; 这 样 的 程序 是 不 良 的 。Java 语 言 禁 止 将 一 个 数 赋值 给 一 
个 字符 。 对 于 程序 员 ， 这 两 种 类 型 错误 都 产生 错误 信息 。 

一 些 语言 要 求 编 译 器 修复 混合 类 型 表达 式 中 的 某 些 类 型 错误 。 当 编译 器 找到 这 样 的 错误 时 ， 它 必须 
插入 生成 相 容 类 型 值 的 转换 。 在 FORTRAN 77 中 ， 整 数 和 浮 点 数 的 加 法 要 求 在 加 法 之 前 把 整数 强制 类 型 
转换 成 浮 点 值 。 同 样 地 ， 关 于 不 同 精度 的 整数 值 间 的 加 法 的 Java 规 则 迫使 将 精度 低 的 值 转换 成 精度 较 高 
的 形式 。Java 语 言 中 的 整数 赋值 可 能 需要 强制 类 型 转换 。 如 果 右 部 的 精度 较 低 ， 那 么 它 就 会 被 转换 成 左 
部 更 高 精度 的 类 型 。 然 而 ， 如 果 左 部 的 精度 比 右 部 低 ， 那 么 赋值 产生 一 个 类 型 错误 (除非 程序 员 插 入 明 
确 的 类 型 转换 操作 来 改变 这 些 类 型 。) 

声明 和 推断 

如 前 所 述 ， 很 多 程序 设计 语言 包括 一 个 “使 用 前 声明 ”规则 。 由 于 强制 声明 ， 每 一 个 变量 都 有 明确 
定义 的 类 型 。 编 译 器 需要 给 常量 指定 类 型 的 方法 。 通 常 有 两 种 指定 方法 。 一 种 是 常量 的 形式 示意 特定 的 
类 型 。 例 如 ，2 表 示 一 个 整数 而 2.0 表 示 一 个 浮 点 数 ， 另 一 种 是 编译 器 根据 它 的 使 用 推断 常量 的 类 型 ， 例 
如 ，sin (2) 表示 2 是 一 个 浮 点 数 ， 而 对 于 x<-2， 若 x 是 整 型 变量 则 表示 2 是 一 个 整数 9S。 使 用 变量 的 声 
明 类 型 、 已 推断 出 的 常量 类 型 和 一 组 完整 的 类 型 推断 规则 ， 编 译 器 可 以 给 变量 和 常量 上 的 任意 表达 式 指 
定 类 型 。 正 如 我 们 将 看 到 的 那样 ， 函 数 调 用 使 这 一 过 程 变 得 复杂 。 

一 些 语言 完全 不 需要 程序 员 书 写 任 何 声明 。 在 这 些 语 言 中 ， 类 型 推断 的 问题 变 得 更 复杂 。4.5 节 描 
述 相 关 的 问题 并 给 出 编译 器 解决 这 些 问题 的 一 些 常用 的 技术 。 

5. 表达 式 的 类 型 推断 . 

类 型 推断 的 目标 是 为 出 现在 程序 中 的 每 一 个 表达 式 指定 一 个 类 型 。 类 型 推断 的 最 简单 的 情况 发 生 在 
编译 器 可 以 为 表达 式 中 的 每 一 个 基础 元 素 指 定 类 型 的 时 候 。 这 时 ， 编 译 器 可 以 为 表达 式 的 分 析 树 的 每 一 
个 叶子 指定 一 个 类 型 。 类 型 推断 需要 所 有 变量 的 声明 、 所 有 常量 的 已 推断 出 的 类 型 ， 以 及 所 有 函数 的 类 
型 信息 。 


O 遗憾 的 是 ， 这 意味 着 “2” 在 不 同 的 上 下 文中 有 不 同 的 意思 。 经 验 表 明 程序 员 善 于 理解 这 样 的 重 载 。 
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类 型 系统 分 类 

有 很 多 术语 被 用 于 描述 类 型 系统 。 在 本 书 中 ， 我 们 已 介绍 了 强 类 型 (strongly typed) 语言 、 无 | 
A (untyped) 语言 和 弱 类 型 (weakly typed) 语言 等 术语 。 类 型 系统 间 的 不 同 以 及 它们 的 实现 间 
的 不 同 也 很 重要 。 

1. 检查 实现 与 无 检查 实现 的 对 比 

程序 设计 语言 的 实现 可 以 选择 进行 充分 的 检查 来 发 现 并 阻止 由 于 类 型 的 错误 使 用 而 引发 的 所 有 
运行 时 错误 。( 这 实际 上 可 以 排除 一 些 特定 值 引发 的 错误 ， 例 如 ， 以 零 为 除数 的 除法 。) 这 样 的 实现 

被 称 为 强 检 查 (strongly checked )。 与 强 检查 实现 相对 的 是 无 检查 实现 (unchecked implementation), 


| 它 假设 程序 是 形式 良好 的 。 这 两 极 之 间 的 实现 都 是 执行 部 分 检查 的 弱 检 查实 现 (weakly checked 


implementations ) 。 


2. 编译 时 活动 与 运行 时 活动 的 对 比 
强 类 型 语言 具有 所 有 推断 和 检查 都 可 在 编译 时 进行 的 性 质 。 在 编译 时 实际 完成 所 有 这 些 工作 的 
实现 称 为 静态 类 型 (statically typed) 和 静态 检查 (statically checked )。 一 些 语言 具有 必须 在 运行 时 
| 进行 类 型 化 并 进行 检查 的 结构 。 我 们 把 这 些 语言 称 为 动态 类 型 (dynamically typed) 和 动态 检查 | 
(dynamically checked)。 更 加 混乱 的 是 ， 编 译 器 设计 者 可 以 用 动态 检查 实现 强 类 型 、 静 态 类 型 语言 。 
| Java 语 言 是 静态 类 型 和 静态 检查 语言 的 例子 ， 只 是 它 的 执行 模型 不 让 编译 器 一 下 子 就 看 到 所 有 的 源 | 





从 概念 上 讲 ， 对 分 析 树 进行 一 次 简单 的 后 序 遍 历 ， 编 译 器 就 可 以 给 表达 式 中 每 个 值 指定 类 型 。 这 使 
编译 器 发 现 每 一 个 对 推断 规则 的 违规 ， 并 在 编译 时 报告 这 样 的 违规 。 如 果 这 一 语言 缺乏 某 些 特征 而 无 法 
进行 这 样 的 简单 推断 的 话 ， 那 么 编译 器 将 需要 使 用 更 复杂 的 技术 。 如 果 编 译 时 类 型 推断 变 得 太 困难 ， 编 
译 器 设计 者 也 许 有 必要 把 一 些 分 析 和 检查 移 到 运行 时 去 做 。 

对 于 表达 式 类 型 引用 的 简单 情况 ， 可 以 直接 遵守 表达 式 的 结构 。 推 断 规 则 用 源 程序 的 术语 描述 这 一 
问题 。 分 析 树 的 评估 策略 是 自 底 向 上 地 进行 的 。 基 于 这 些 原因 ， 表 达 式 类 型 推断 已 成 为 展示 上 下 文 相关 
分 析 的 一 个 典型 例子 。 

6. 类 型 推断 中 过 程 间 的 相关 问题 

本 质 上 ， 表 达 式 的 类 型 推断 取决 于 形成 可 执行 成 程序 的 其 他 过 程 。 甚 至 在 最 简单 的 类 型 系统 中 ， 表 
达 式 也 包含 函数 调用 。 编 译 器 必须 检查 这 些 调用 。 编 译 器 必须 确保 每 一 个 实际 参数 与 相应 的 形式 参数 是 
相 容 的 。 它 必须 决定 在 其 后 的 推断 所 用 的 所 有 返回 值 的 类 型 。 

为 了 分 析 和 理解 过 程 调用 ， 编 译 器 需要 为 每 一 个 函数 做 一 个 类 型 嘲 名 (type signature). KWEH 
描述 形式 参数 和 返回 值 的 类 型 。 例 如 ，C 语 言 的 标准 函数 库 中 的 strien 函 数 取 类 型 为 char * 的 一 个 操作 
数 ， 并 返回 包含 以 字 节 为 单位 的 这 个 操作 数 的 长 度 的 int 型 的 值 ， 其 中 null 终止 符 不 计 在 内 。 在 C 中 ， 程 
序 员 可 以 使 用 如 下 形式 的 函数 原型 (function prototype) 来 记录 这 一 事实 。 


unsigned int strlen(const char *s); 


这 一 函数 原型 声明 strien 取 类 型 为 char * 的 参数 ， 而 且 它 不 更 改 该 参数 ， 这 由 const 表 示 。 函 数 返 
回 一 个 非 负 整数 。 用 更 抽象 的 表 记 法 写 出 这 一 函数 ， 我 们 可 以 写成 : 
strlen : const char * — unsigned int 


上 式 读 作 “Sstr1en 是 一 个 取 一 个 常量 值 字符 串 并 返回 一 个 无 符号 整数 的 函数 " 。 作 为 第 二 个 例子 ， 典 型 
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的 Scheme 函数 fi1ter 有 类 型 署名 : 
filter: (a—boolean) x list of a — list of a 


也 就 是 说 ，fiiter 是 一 个 取 两 个 参数 的 函数 。 第 一 个 参数 应 该 是 一 个 把 某 一 类 型 a 映射 到 一 个 布尔 类 型 ， 
写作 (a 一 boolean) 的 函数 ， 而 第 二 个 参数 应 该 是 一 个 元 素 类 型 仍 为 a 的 列表 。 给 定 这 些 类 型 的 参数 ， 
filter 返 回 一 个 元 素 类 型 为 a 的 列表 。 函 数 fi1ter 展 示 参 数 多 态 性 (parametric polymorphism): 它 的 结 
果 类 型 是 它 的 参数 类 型 的 函数 。 

为 了 执行 精确 的 类 型 推断 ， 编 译 器 需要 为 每 一 个 函数 做 一 个 类 型 署名 。 编 译 器 能 够 以 几 种 方法 获取 
这 一 信息 。 编 译 器 可 以 取消 分 块 编译 ， 需 要 把 整个 程序 作为 编译 的 一 个 单位 。 编 译 器 可 以 要 求 程序 员 为 
每 一 个 函数 提供 类 型 署名 ; 这 通常 以 强制 函数 原型 的 形式 出 现 。 编 译 器 可 以 把 类 型 检查 推迟 到 链接 时 或 
运行 时 ， 当 所 有 这 些 信 息 都 可 用 时 进行 。 最 后 ， 编 译 器 设计 者 可 以 把 编译 器 嵌入 到 程序 开发 系统 中 。 这 
样 的 系统 汇集 必要 的 信息 并 在 需要 时 将 这 些 信息 传 给 编译 器 。 所 有 这 些 方法 都 可 在 现实 的 系统 中 看 到 。 


4.3 属性 文法 框架 


为 执行 上 下 文 相 关 分 析 而 提出 的 一 种 形式 是 属性 文法 (attribute grammar), 或 属性 化 上 下 文 无 关 文 
法 。 属 性 文法 在 上 下 文 无 关 文法 的 基础 上 增加 了 一 组 描述 计算 的 规则 。 每 一 个 规则 使 用 其 他 属性 的 值 定 
义 一 个 值 或 属性 (attribute )。 规 则 将 这 一 属性 与 特定 的 文法 符号 结合 起 来 ; :出 现在 分 析 树 中 的 文法 符号 
的 每 一 个 实例 都 有 这 一 属性 的 相应 实例 。 因 为 属性 实例 与 分 析 树 结 点 之 间 的 这 样 的 关系 ， 我 们 通常 把 属 
性 域 添加 到 分 析 树 的 结 点 上 ， 以 此 来 描述 我 们 的 实现 。 

为 了 使 这 些 表 记 法 具体 化 ， 考 虚 带 符号 二 进 制 数 的 上 下 文 无 关 文 法 。 文 法 SBN =(T，NT，S, P) 的 
定义 如 下 所 示 : 

T ={+, -, 0, 1} 


NT = {Number, Sign, List, Bit} 


S = {Number} 
Number — Sign List 

P "Sign 一 + Sign - 
List — List Bit List — Bit 
Bit 0 Bit— 1 


L(SBN) 包含 所 有 带 符号 二 进 制 数 ， 如 ，- 101、+11、-01 和 +11111001100。 它 将 无 符号 二 进 制 数 ， 
如 10 排 除 在 外 。 

从 SBN 出 发 ， 我 们 可 以 构建 注解 带 符号 二 进 制 数 所 表示 的 值 NMumber 的 属性 文法 。 为 了 从 上 下 文 无 关 
文法 构建 一 个 属性 文法 ， 我 们 必须 决定 每 一 个 结 点 所 需 的 属性 ， 必 须 为 产生 式 详细 描述 定义 这 些 属 性 的 
值 的 规则 。 对 于 我 们 的 SBN 属 性 文法 ， 我 们 需要 下 面 的 属性 : 





符 号 . 属 性 
Number value 

Sign negative 

List position, value 


Bit position, value 
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在 这 种 情况 下 ,终结 符 不 需要 属性 。 

图 4-4 给 出 带 有 属性 规则 的 SBN 的 产生 式 。 当 某 个 符号 多 次 出 现在 一 个 产生 式 中 时 ， 我 们 在 相应 文 
法 符号 上 加 上 下 标 ， 以 此 来 消除 对 规则 中 的 符号 引用 的 歧义 性 。 因 此 ， 在 产生 式 5 和 相应 的 规则 中 ，list 
的 出 现 都 有 下 标 。 


产 生 式 属性 规则 


Number ~ Sign List List.position — O 
if Sign.negative 
then Number.value +- - List.value 
else Number.value + List.value 
Sign + + Sign.negative + false 
Sign > - Sign.negative + true 


List > Bit Bit position +- List. position 
List.value +- Bit.value 

Listo 一 List, Bit List, position +- Listo. position + 1 
Bit.position +- List.position 
Listp.value + List;.value + Bit.value 
Bit.value — O 
Bit.value «2Bitposition 





图 4-4 带 符号 二 进 制 数 的 属性 文法 


这 些 规则 使 用 产生 式 中 涉及 的 其 他 符号 的 属性 以 及 文字 常量 来 描述 某 个 属性 的 值 。 从 而 允许 规则 从 
左 到 右 传 递 信息 ， 也 允许 另 一 方向 的 信息 流传 输 。 产 生 式 4 取 决 于 两 个 方向 的 信息 传输 。 第 一 个 规则 把 
Bit.position 设 置 为 List.position， 而 第 二 个 规则 把 List. va1Ue 设 置 为 Bir. ya7uve。 存 在 更 简单 的 属性 设 
ths 我 们 特别 选择 这 一 设计 以 展示 双向 属性 传输 。 

给 定 上 下 文 无 关 文 法 中 的 一 个 串 ， 属 性 规则 把 Numper.vaJue 设 置 为 二 进 制 输 入 串 的 十 进 制 值 。 例 
如 ， 串 - 101 引 发 图 4-5 左 边 所 示 的 属性 。( 其 中 的 属性 名 被 缩写 。) 注意 Number .va1ue 有 值 -5。 


Number os Number os 
SİT neg-true List (as SIN neg:true p Pais 
Listi Bit P52 List’, Bit 585) 
List P52 Bir Pos; List 052 pk 
Bir POs Bir P52 本 
- 1 0 1 - 1 0 1 


— 101 的 分 析 树 一 101 的 相关 图 
图 4-5 带 符号 二 进 制 数 - 101 的 属性 树 


为 了 评估 L(SBN) 中 的 某 个 语句 的 属性 分 析 树 ， 我 们 使 用 各 规则 所 描述 的 属性 对 分 析 树 中 各 结 点 进 

行 实例 化 。 例 如 ， 这 为 每 一 个 List 结 点 中 的 value 和 position 生 成 属性 实例 。 每 一 个 规则 定义 一 组 相关 

性 ; 被 定义 的 属性 取决 于 规则 的 各 个 参数 。 处 理 整个 分 析 树 后 ， 这 些 相 关 性 形成 一 个 属性 起 关 图 

172| (attribute-dependence graph), 图 中 的 边 刻 画 规则 评估 中 值 的 流向 ; MM node, field Anode, field, P50 FAs 
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定义 nodekjield 的 规则 以 modeijField 的 值 为 它 的 一 个 输入 。 图 4-5 的 右边 给 出 串 - 101 的 分 析 树 的 相关 图 。 

我 们 早 前 提 到 的 值 的 双向 传输 (例如 ， 产 生 式 4 中 的 双向 传输 ) 导致 这 一 相关 图 中 同时 存在 表示 向 
根 (Number) 方向 从 下 往 上 传输 的 颖 和 向 叶 方 向 从 上 往 下 传输 的 绪 。List 结 点 最 清楚 地 给 出 这 一 效应 。 
我 们 基于 值 的 流向 来 区 分 属性 。 

(1) 合成 属性 (synthesize attribute ) 

通常 对 于 一 个 结 点 的 属性 ， 当 它 的 值 是 由 该 结 点 的 子 结 点 的 属性 定义 时 ， 称 为 合成 属性 。 通 常 ， 我 
们 通过 自 底 向 上 的 传输 计算 分 析 树 中 合成 属性 的 值 。( 叶 结 点 不 可 能 有 合成 属性 。) 

(2) 继承 属性 (inherited attribute ) 

对 于 一 个 结 点 的 属性 ， 当 它 的 值 是 由 结 点 自身 的 属性 、 兄 弟 结 点 的 属性 以 及 父 结 点 的 属性 定义 时 ， 
称 为 继承 属性 。 通常， 我 们 通过 自 顶 向 下 和 横向 的 传输 计算 分 析 树 中 继承 属性 的 值 。( 根 结 点 不 能 有 继 
承 属性 。) | 

在 图 4-5 所 示 的 例子 中 ， 属 性 va1ue 和 negative 是 合成 属性 ， 而 属性 position 是 继承 属性 。 

评估 属性 的 任何 设计 框架 都 必须 遵循 草 涵 于 属性 相关 图 中 的 关系 。 每 个 属性 必须 由 某 个 规则 定义 。 
如 果 这 个 规则 取决 于 其 他 属性 的 值 ， 那 么 直到 所 有 这 些 值 都 被 定义 为 止 ， 不 能 评估 这 个 规则 。 如 果 这 一 
规则 不 取决 于 其 他 属性 的 值 ， 那 么 规则 必须 根据 某 个 常量 或 外 部 的 信息 生成 属性 值 。 只 要 不 存在 取决 于 
其 自身 的 值 的 规则 ， 那 么 这 些 规则 就 应 该 惟一 定义 每 一 个 值 。 

当然 ， 规 则 可 以 直接 或 间接 地 引用 其 自身 的 结果 。 包 含 这 样 规则 的 属性 文法 称 为 循环 (circular) X 
法 。 我 们 暂时 忽略 循环 文法 ; 4.3.2 节 将 讨论 这 一 问题 。 

相关 图 刻画 这 样 一 个 值 的 传输 : 评估 程序 在 评估 属性 树 的 实例 时 必须 遵守 值 的 传输 方向 。 如 果 文 法 
不 是 循环 的 ， 它 在 属性 上 附加 一 个 偏 序 。 这 一 偏 序 决定 定义 各 属性 的 规则 何 时 可 以 被 评估 。 评 估 顺 序 与 
规则 在 文法 中 出 现 的 顺序 无 关 。 

考虑 最 上 方 的 List 结 点 ， 即 Number 的 右 子 结 点 相关 的 规则 的 评估 顺序 。 这 一 结 点 是 由 产生 式 5 即 
List List Bit 生 成 的 ， 运 用 这 个 产生 式 把 3 个 规则 加 入 到 评估 中 。 为 List 结 点 的 子 结 点 设置 继承 属性 的 两 
个 规则 必须 首先 执行 。 它 们 依赖 于 List. position 的 值 并 为 这 一 结 点 的 子 树 设置 属性 position。 设 置 List 
结 点 的 va1ue 属 性 的 第 三 个 规则 直到 这 两 棵 子 树 都 已 定义 了 Val1ue 属 性 时 才能 执行 。 因 为 只 有 在 List 结 点 
处 的 前 两 个 规则 被 评估 后 这 些 子 树 才 能 被 评估 ， 因 此 在 评估 序列 中 ， 前 两 个 规则 的 评估 较 早 而 第 三 个 规 
则 的 评估 较 晚 。 

为 了 创建 并 使 用 属性 文法 ， 编 译 器 设计 者 为 文法 中 的 每 一 个 符号 决定 一 组 属性 ， 并 为 计算 这 些 属性 
的 值 设计 一 组 规则 。 这 些 规 则 描述 对 任 给 合法 分 析 树 的 计算 。 为 了 创建 一 个 实现 ， 编 译 器 设计 者 必须 创 
建 一 个 评估 程序 ;可 以 手工 创建 评估 程序 ， 也 可 以 使 用 评估 程序 生成 器 。 后 者 更 具 吸 引力 。 评 估 程 序 生 
成 器 以 属性 文法 的 描述 为 输入 。 作 为 输出 ， 它 生成 评估 程序 的 代码 。 这 就 是 属性 文法 对 编译 器 设计 者 有 
吸引 力 的 地 方 ; 这样 的 工具 采用 高 级 、 非 过 程 性 的 描述 ， 并 且 自 动 地 生成 实现 。 

属性 文法 背后 的 一 个 重要 的 思想 就 是 属性 规则 与 上 下 无 关 文法 的 产生 式 相 关联 的 表 记 方式 。 因 为 这 些 
规则 是 函数 式 的 ， 它 们 生成 的 值 与 评估 顺序 无 关 ， 只 要 顺序 反映 了 旨 涵 在 属性 相关 图 中 的 关系 即 可 。 在 实 
践 中 对 于 所 有 规则 来 说 ， 在 它 的 所 有 输入 都 已 被 定义 后 才 进 行 评 估 的 任意 评估 顺序 都 满足 这 一 相关 性 。 


4.3.1 评估 方法 


仅 当 我 们 能 够 构建 出 通过 解释 这 些 规则 的 评估 程序 来 自动 地 评估 问题 实例 时 ， 比 如 一 个 具体 的 分 析 
树 ， 属 性 文法 才 具 有 实际 意义 。 文 献 已 经 非常 详细 地 提出 了 很 多 属性 评估 技术 。 通 常 这 些 技术 可 以 划分 
成 下 面 三 个 类 别 。 
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1. 动态 方法 

这 些 技术 使 用 特定 属性 分 析 树 的 结构 来 决定 评估 顺序 。Knuth 关 于 属性 文法 的 原始 论文 提出 按 类 似 
于 数据 流 计算 机 体系 结构 的 方式 操作 的 评估 程序 ， 每 个 规则 只 要 当 它 的 所 有 操作 数 都 可 用 时 “被 激活 ”。 
在 实践 中 ， 可 以 使 用 一 个 已 可 评估 属性 的 队列 来 实现 这 一 方法 。 当 一 个 属性 被 评估 后 ， 检 查 它 在 属性 相 
关 图 中 的 所 有 后 继 是 否 已 经 准备 就 绪 (参见 12.3 节 中 的 “列表 调度 ”的 描述 ) 。 与 此 相关 的 设计 框架 构 
建 属 性 相关 图 ， 对 其 进行 拓扑 排序 ， 并 使 用 这 一 拓扑 顺序 来 评估 属性 。 

2. 遗忘 方法 

在 这 些 方法 中 ， 评 估 顺 序 既 独立 于 属性 文法 又 独立 于 特定 的 属性 分 析 树 。 大 体 上 ， 系 统 的 设计 者 
选择 一 个 相信 是 既 适 合 于 属性 文法 又 适合 于 评估 环境 的 方法 。 这 一 评估 风格 的 例子 包括 反复 从 左 到 右 
扫描 (直到 所 有 属性 都 有 值 ) 、 反 复 从 右 到 左 扫描 ， 以 及 从 左 到 右 、 从 右 到 左 交 替 扫 描 。 这 些 方法 具 
有 简单 的 实现 和 相对 较 少 的 运行 时 负荷 。 当 然 ， 这 些 方法 缺乏 属性 化 了 的 特定 树 的 信息 所 带 来 的 任何 
改进 。 

3. 基于 规则 的 方法 

基于 规则 的 方法 通过 对 属性 文法 进行 静态 分 析 来 构建 一 个 评估 顺序 。 在 这 一 框架 下 ， 评 估 程 序 依赖 
于 文法 的 结构 ; 因此 ， 分 析 树 指导 规则 的 运用 。 在 带 符号 二 进 制 数 的 例子 中 ， 产 生 式 4 的 评估 顺序 应 该 
是 ， 使 用 第 一 个 规则 设置 Bit.posftiyon， 递 归 向 下 传递 到 Bir， 然 后 在 返回 时 使 用 Bir. va1ue 来 设置 
List.Va1ue。 同 样 地 ， 对 于 产生 式 5， 评 估 有 顺序 应 该 是 ， 先 评估 前 两 个 规则 来 定义 右 部 的 属性 pos1tion， 
然后 递归 向 下 到 每 一 个 子 结 上 点。 返回 时 ， 它 评估 第 三 个 规则 来 设置 父 结 点 List 的 List. value 域 。 执 行 必要 
的 离线 静态 分 析 的 工具 可 以 生成 基于 规则 的 快速 评估 程序 。 


4.3.2 循环 性 


循环 属性 文法 可 能 引发 循环 属性 相关 图 。 当 相关 图 含有 循环 时 ， 我 们 的 评估 模型 就 会 失败 。 编 译 器 
的 这 种 失败 会 引发 严重 的 问题 ， 例 如 编译 器 也 许 不 能 为 它 的 输入 生成 代码 。 相 关 图 中 的 循环 的 这 种 灾难 
性 的 影响 表明 这 一 问题 值得 关注 。 

如 果 编 译 器 使 用 属性 文法 ， 那 么 它 必 须 有 适当 处 理 循环 性 问题 的 方法 。 有 两 个 可 行 的 方法 。 

1. 回避 

编译 器 设计 者 可 以 把 属性 文法 限制 到 一 个 不 能 引起 循环 相关 图 的 集合 上 。 例 如 ， 限 制 文法 只 使 用 合 
成 属性 消除 产生 循环 相关 图 的 可 能 性 。 存 在 非 循 环 属 性 文法 的 更 一 般 集 合 ; 其 中 的 某 些 文法 ， 如 强 非 往 
环 属 文 法 (strongly noncircular attribute grammar) 具有 多 项 式 时 间 成 员 资格 测试 。 

2. 评估 

编译 器 设计 者 可 以 使 用 给 每 一 个 属性 ， 甚 至 那些 包含 循环 的 属性 指定 值 的 评估 方法 。 评 估 程 序 可 以 
在 循环 上 迭代 直到 这 些 值 达 到 一 个 不 动 点 。 这 样 的 评估 程序 可 以 回避 由 完全 属性 树 失败 引发 的 问题 。 

在 实践 中 ， 大 多 数 属性 文法 系统 只 注意 非 循环 文法 。 如 果 属 性 文法 是 循环 的 ， 那 么 基于 规则 的 评估 
方法 也 许 不 能 构建 一 个 评估 程序 。 遗 忘 方法 和 动态 方法 会 设法 评估 循环 相关 图 ; 它们 可 能 在 定义 某 些 属 
性 实例 时 失败 。 


4.3.3 ”扩展 例子 


为 了 更 好 地 理解 作为 描述 语言 语法 上 的 计算 的 工具 的 属性 文法 的 优 缺 点 ， 我 们 仔细 考察 两 个 更 详细 
的 例子 ， 一 个 为 一 个 简单 的 类 Algol 语 言 的 表达 式 树 推断 类 型 ， 另 一 个 估 测 直线 代码 序列 的 执行 时 间 。 
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1. 推断 表达 式 类 型 

设法 为 类 型 语言 生成 有 效 代码 的 任何 编译 器 都 要 面临 为 程序 中 每 一 个 表达 式 推断 类 型 的 问题 。 本 质 
， 这 一 问题 依赖 于 上 下 文 相 关 的 信息 ; 与 1dent 或 num 相 关 的 类 型 依赖 于 它们 的 身份 ， 即 它们 的 文本 名 
而 不 是 它们 的 语法 范畴 。 
考虑 由 第 3 章 给 出 的 经 典 表达 式 文 法 而 得 到 的 表达 式 的 类 型 推断 问题 的 一 个 简化 版 本 。 假 设 这 些 表 
达 式 表示 成 分 析 树 ， 而 且 表 示 ident 或 num 的 任意 结 点 都 已 有 type 属 性 。( 我 们 将 在 后 面 阐述 把 类 型 信息 
变 成 这 些 type 属 性 的 问题 . ) 对 于 文法 中 的 每 一 个 算术 操作 符 ， 我 们 需要 一 个 把 两 个 操作 数 的 类 型 映射 
到 结果 类 型 的 函数 。 我 们 分 别称 这 些 函 数 为 F;,、F_-、F .和 F,; 这 些 函 数 描绘 在 表 中 可 以 找到 如 图 4-1 所 
示 的 信息 。 使 用 这 些 假设 ， 我 们 可 以 写 出 对 树 中 每 个 结 点 定义 type 属 性 的 属性 规则 。 图 4-6 给 出 这 些 属 
性 规则 。 


4t tr 


- 


产生 式 属性 规则 


> Expr, + Term Expro.type — F+(Expr,.type, Term.type) 

| Expr, - Term Expro.type + F - (Expr; .type, Term.type) 
Term Expro.type + Term.type 
Term, x Factor Termo.type + F x (Term,.type, Factortype) 


Term, + Factor Termo.type + F + (Term, .type,Factortype) 
Factor Termy.type + Factortype 

( Expr) Factor.type  Exprtype 

num num.type is already defined 

ident ident.type is already defined 








图 4-6 推断 表达 式 类 型 的 属性 文法 


如 果 x 有 类 型 integer (WH) 且 y 有 类 型 real ( 记 作 R)， 和 那么 上 面 的 框架 对 输入 字符 串 x-2 x yE 
成 如 下 所 示 的 属性 分 析 树 : 


Expriyper 
ap wel — TermypeR 
Term ype:T Term ype:t X <ident, Y> ypeR 


<ident, X>ype:7 <num, 2>ppe-7 


叶 结 点 有 正确 初始 化 的 type 属 性 。 其 余 的 属性 由 图 4-6 的 规则 来 定义 ， 其 中 假设 F;、F_、F. 和 下 ,反映 
FORTRAN 77 的 规则 。 

仔细 观察 属性 规则 表明 ， 所 有 属性 都 是 合成 属性 。 因 此 ， 分 析 树 中 的 所 有 相关 性 都 是 从 子 结 点 流向 
它 的 父 结 点 。 这 样 的 文法 有 时 被 称 为 S 属 性 文法 (S-attributed grammar)。 这 种 类 型 的 属性 具有 简单 、 基 
于 规则 的 评估 框架 。 它 与 自 底 向 上 分 析 十 分 吻合 ; 每 一 个 规则 可 以 在 语法 分 析 器 通过 相应 的 右 部 进行 归 
约 时 得 到 评估 。 这 一 属性 文法 范式 (paradigm) 非常 适合 我 们 的 问题 。 它 的 描述 很 短 ， 也 很 容易 理解 。 
它 导 致 一 个 高 效 的 评估 程序 。 

对 属性 表达 式 树 的 仔细 观察 显示 两 种 情况 : 在 这 两 种 情况 中 ， 操 作 符 的 一 个 操作 数 的 类 型 不 同 于 操 
作 结 果 的 类 型 。 在 FORTRAN 77 中 ， 这 要 求 编译 器 在 该 操作 数 与 操作 符 之 间 插 入 一 个 转换 操作 。 对 于 表 
示 2 与 y 的 乘积 的 Term 结 点 ， 编 译 器 将 把 2 从 整数 表达 式 转换 成 实数 表达 式 。 对 于 树 的 根 结 点 处 的 Expr 结 
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点 ， 编 译 器 将 把 x 从 整数 转换 成 实数 。 遗 憾 的 是 ， 更 改 分 析 树 不 能 很 好 地 适应 属性 文法 范式 。 
为 了 在 属性 树 中 表示 这 些 转 换 ， 我 们 可 以 把 一 个 保留 转换 后 的 类 型 的 属性 添加 到 每 一 个 结 点 上 ， 
并 加 入 设置 该 属性 的 相应 规则 。 另 外 ， 我 们 还 可 以 依赖 于 从 分 析 树 生成 代码 的 过 程 在 遍历 的 过 程 中 比 
较 父 结 点 和 子 结 点 的 类 型 ， 并 插入 必要 的 转换 。 前 面 的 方法 给 属性 评估 遍 增加 一 些 工作 ， 它 局 部 化 对 
一 个 分 析 树 结 点 的 转换 所 需要 的 所 有 信息 。 后 面 的 方法 将 转换 工作 推迟 到 代码 生成 ， 它 的 代价 是 类 型 
和 转换 的 信息 需要 跨越 编译 器 的 两 个 不 同 的 部 分 。 这 两 个 方法 都 有 效 ; 它们 之 间 的 差异 主要 是 侧重 点 
不 同 的 问题 。 
2. 一 个 简单 的 执行 时 间 估 测 器 
作为 第 二 个 例子 ， 考 虑 估 测 一 系列 赋值 语句 的 执行 时 间 问 题 。 我 们 通过 把 三 个 新 产生 式 加 入 到 经 典 
表达 式 文法 来 生成 赋值 语句 序列 。 
Block — Block Assign 
| Assign 
Assign — ident = Expr; 


其 中 Expr 来 自 表达 式 文法 。 结 果 文 法 非常 简单 ， 因 为 它 只 允许 把 简单 标识 符 当 作 变 量 且 不 含 函数 调 
用 。 但 是 ， 它 也 够 复杂 足以 用 于 调查 在 估 测 运行 时 行为 中 引发 的 复杂 性 。 

图 4-7 给 出 估 测 赋值 语句 块 的 执行 时 间 的 属性 文法 。 属 性 规则 估 测 这 一 语句 块 的 循环 计数 ， 假 设 处 
理 器 一 次 执行 一 个 操作 。 与 推断 表达 式 类 型 的 属性 文法 类 似 ， 这 一 文法 只 使 用 合成 属性 。 估 测 出 现 于 分 
析 树 最 上 端 Block 结 点 的 cost 属 性 中 。 方 法 很 简单 。 自 底 向 上 计算 代价 ; 读 例子 时 ， 我 们 从 Factor 的 产生 
式 开始 向 上 进行 ， 直 到 Block 的 产生 式 。 函 数 cost 返 回 给 定 的 ILOC 操 作 的 等 待 时 间 。 


生 式 
Block, Assign 


Assign 
ident = Expr; 


Expr, + Term 


Expr, — Term 


Term 
Term, x Factor 


Term, ~ Factor 


Factor 
(Expr) 
num 
ident 


属性 规则 


{ Blocky.cost — Block, .cost + 
Assign.cost } 

{ Blocko.cost ¢ Assign.cost } 

{ Assign.cost 一 Cost(store) + 
Expr.cost } 

{ Expro.cost — Expr;.cost + 
Cost(add) + Term.cost } 

{ Expro.cost  Expr,.cost + 
Cost(sub) + Term.cost } 

{ Expro.cost +- Term.cost } 

{ Termo.cost +- Term,.cost + 
Cost(mult) + Factor.cost } 

{ Termo.cost — Term,.cost + 
Cost (div) + Factor.cost } 

{ Termg.cost + Factor.cost } 

{ Factor.cost +- Expr.cost } 

{ Factor.cost  Cost(Toad!1) } 

{ Factor.cost — Cost(load) } 





图 4-7 估 测 执行 时 间 的 简单 属性 文法 





bP HKD 105 


3. 改进 执行 代价 估 测 器 

为 了 使 这 一 例子 更 具 实 际 意义 ， 我 们 以 通过 编译 器 处 理 变量 的 方式 改进 它 的 模型 。 代 价 估 测 属性 文 
法 的 初期 版 本 ， 假 设 编译 器 为 每 一 次 变量 的 引用 生成 一 个 独立 的 1oad 操 作 。 对 于 赋值 语句 x=y+y， 这 一 
模型 对 y 做 两 次 装 入 操作 。 很 少 有 编译 器 对 y 生 成 多 余 的 装 入 。 更 有 可 能 的 是 ， 编 译 器 将 生成 如 下 所 示 的 
只 一 次 装 入 y 的 序列 : 

loadAI Tarp, @y > ry 

add rysry > mx 


storeAl mx => Tarp »@x 


为 了 更 好 地 接近 编译 器 的 行为 ， 我 们 可 以 修改 属性 文法 ， 对 于 语句 块 中 的 每 个 变量 只 考虑 进行 一 次 装 入 
的 负荷 。 这 需要 更 复杂 的 属性 规则 。 

为 了 更 精确 地 对 装 入 计数 , 规则 必须 通过 变量 名 跟踪 对 每 一 个 变量 的 引用 。 这 些 名 字 超 出 了 文法 范围 ， 
因为 文法 跟踪 语法 范畴 ident 而 不 是 跟踪 各 个 名 字 ， 如 x、y、z 等 。ident 的 规则 应 遵循 如 下 一 般 框 架 : 


LJ 
if (ident has not been loaded ) 
then Factor.cost +- Cost(load); 
else Factor.cost + 0; 


实现 这 一 工作 的 关键 是 检测 “ident has not been loaded.” 

为 了 实现 这 一 检测 ， 编 译 器 设计 者 可 以 加 入 一 个 属性 来 保存 所 有 已 装 入 变量 的 集合 。 产 生 式 
Block 一 Assign 可 以 初始 化 这 一 集合 。 规 则 必须 沿 着 表达 式 树 将 这 一 集合 传递 到 每 一 个 赋值 。 这 意味 着 每 
一 个 结 点 带 有 两 个 集合 Before 和 After。 每 个 结 点 的 Before 集 合 包含 较 早出 现在 Biock 中 的 所 有 ident 的 
名 字 ; 这 些 名 字 中 的 每 一 个 必须 是 已 装 入 的 。 一 个 结 点 的 4After 集 合 包 含 在 它 的 Before 集 合 内 的 所 有 名 
字 ， 再 加 上 在 以 该 结 点 为 根 的 子 树 中 应 该 被 装 和 人 的 所 有 ident 。 

Factor 的 扩展 规则 如 图 4-8 所 示 。 这 一 代码 假设 它 可 以 得 到 每 一 个 ident 的 文本 名 。 派 生 (Expr) 的 
第 一 个 产生 式 把 Before 集 合 向 下 拷贝 到 Expr 子 树 上 ， 并 且 把 Expr 子 树 的 4After 集 合 向 上 拷贝 到 Factor 上 。 
派生 num 的 第 二 个 产生 式 只 将 其 父 结 点 的 Before 集 合 拷 贝 到 这 一 父 结 点 的 4fter 集 合 。Num 必 须 是 树 中 的 
一 个 叶子 ; 因此 ， 不 需要 更 进一步 的 动作 。 派 生 ident 的 最 后 一 个 产生 式 执 行 最 关键 的 工作 。 它 检测 
Before 集 合 ， 决 定 是 否 需要 一 次 装 入 ， 并 相应 修改 父 结 点 的 cost 和 After 属 性 。 


FER 属性 规则 


Factor > ( Expr) { Factor.cost — Expr.cost; 
Expr.Before +- Factor.Before; 
Factor After — Expr After } 
| num { Factor.cost +- Cost(\oad1); 
Factor After — Factor.Before } 
| ident {if (ident.name ¢ Factor.Before) 


then 
Factor.cost + Cost(load); 
FactorAfter +- Factor.Before 
U { ident.name } 
else 
Factor.cost + 0; 
FactorAfter — Factor.Before } 





图 4-8 跟踪 Factor 产 生 式 中 装 和 的 规则 
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为 了 完成 上 面 的 描述 ， 编 译 器 设计 者 必须 加 入 在 分 析 树 上 拷贝 gefore 集 合 和 4fter 集 合 的 规则 。 有 
时 被 称 为 拷贝 规则 的 这 些 规则 把 各 个 Factor 结 点 的 Before 和 集合 和 After 集 合 联系 起 来 。 因 为 属性 规则 只 
能 引用 局 部 的 属性 ， 即 一 个 结 点 的 父 结 点 、 兄 弟 结 点 和 子 结 点 的 属性 ， 这 一 属性 文法 必须 显 式 地 拷贝 分 
析 树 上 的 值 以 确保 它们 的 局 部 性 。 图 4-9 给 出 这 一 文法 中 其 他 产生 式 所 需 的 规则 。 另 外 一 个 规则 被 加 入 
进来 ; 它 将 第 一 个 赋值 (hssigh) 语句 的 Before 集 合 初始 化 为 空 集 。 


产 生 式 属性 规则 


Blocky 一 Block, Assign { Blocko.cost + Block;.cost + 
Assign.cost; 
Assign.Before + Block, After; 
Blocko.After — AssignAfter } 
| Assign { Blocko.cost + Assign.cost; 
Assign.Before — 0; 
Blocky.After — AssignAfter } 
Assign 一 Identifier =Expr; { Assign.cost — Cost(store) + 
Expr.cost; 
Expr.Before + Assign.Before; 
AssignAfter — ExprAfter } 
Expro 一 Expr, + Term { Expro.cost — Expr,.cost + 
Cost(add) + Term.cost; 
Expr;.Before  Expro.Before; 
Term.Before — Expr,After; 
ExproAfter — TermAfter } 
| Expr, — Term {Expro.cost + Expr,.cost + 
Cost(sub) + Term.cost; 
Expr,.Before 一 Expro.Before; 
Term.Before — Expr, After; 
ExproAfter — TermAfter } 
| Term { Expro.cost — Term.cost; 
Term.Before + Expro.Before; 
Expro. After — TermAfter } . 
Termo — Term, x Factor { Termo.cost — Term,.cost + 
Cost(mult) + Factor.cost; 
Term,.Before + Termy.Before; 
Factor.Before — Term,After; 
Term)After + FactorAfter } 
| Term, + Factor { Termo.cost  Term,.cost + 
Cost(div) + Factor.cost; 
Term,.Before + Termo.Before; 
Factor.Before + Term,.After; 
TermoAfter +— FactorAfter } 
{ Termo.cost + Factor.cost; 
Factor.Before 一 Termy.Before; 
TermyAfter — FactorAfter } 





图 4-9 跟踪 装 入 的 拷贝 规则 
这 一 模型 比 简单 的 模型 复杂 得 多 。 它 的 规则 是 简单 模型 的 三 倍 多 ; 我 们 必须 写 出 、 理 解 、 评 估 每 一 
个 规则 。 它 既 使 用 合成 属性 又 使 用 继承 属性 ; 简单 的 自 底 向 上 评估 策略 不 再 适用 。 最 后 ， 处 理 Before 和 
After 集 合 的 规则 需要 额外 注意 .我们 希望 通过 使 用 基于 高 级 描述 的 系统 来 回避 这 样 的 低级 描述 。 


4. 再 谈 表 达 式 类 型 推 类 
在 最 初 的 关于 推断 表达 式 类 型 的 讨论 中 ， 我 们 假设 ident . type 和 num. type 属 性 是 由 某 一 外 部 机 制 
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定义 好 的 。 为 了 使 用 属性 文法 填充 这 些 值 ， 编 译 器 设计 者 需要 为 处 理 声明 的 文法 部 分 开发 一 组 规则 。 

这 些 规则 需要 为 与 声明 语法 相关 的 产生 式 中 的 每 一 个 变量 记录 其 类 型 信息 。 这 些 规则 需要 收集 信息 
以 便 使 用 较 少 的 属性 包含 所 有 已 声明 变量 的 必要 信息 。 这 些 规则 需要 把 这 一 信息 传播 到 分 析 树 中 所 有 可 
执行 语句 的 祖先 结 点 上 ， 然 后 向 下 拷贝 到 每 个 表达 式 中 。 最 后 ， 在 每 个 ident 或 num 叶 结 点 处 ， 规 则 需要 
从 汇集 的 信息 中 提取 正确 的 事实 。 

这 样 的 规则 与 我 们 为 跟踪 装 和 所 开发 的 规则 有 很 多 相似 之 处 ， 但 是 在 细节 上 这 些 规 则 更 复杂 。 这 些 
规则 还 创建 巨大 、 复 杂 且 必须 在 分 析 树 上 到 处 拷贝 的 属性 。 在 朴素 的 实现 中 ， 拷 贝 规 则 的 每 一 个 实例 都 
将 创建 一 个 新 的 拷贝 。 这 其 中 一 些 找 贝 是 共享 的 ， 但 是 由 多 个 子 结 点 的 信息 而 创建 的 大 部 分 拷贝 将 不 一 
致 ( 因 此， 需要 不 同 的 拷贝 )。 在 前 面 的 例子 中 的 Before 集 合 和 After 集 合 也 引发 同样 的 问题 。 

5. 对 执行 代价 估 测 器 的 最 后 改进 

虽然 跟踪 装 入 改进 了 估 测 执行 代价 的 真实 度 ， 还 有 可 能 对 其 做 进一步 的 改进 。 例 如 ， 考 虑 这 一 模型 
上 有 限 数目 的 寄存 器 的 影响 。 至 此 ， 我 们 的 模型 一 直 假设 目标 计算 机 提供 无 限定 数目 的 寄存 器 。 在 现实 
中 ， 计 算 机 提供 较 少 的 寄存 器 。 为 了 给 寄存 器 组 的 能 力 建 模 ， 估 测 器 可 以 限制 允许 出 现在 8efore 集 合 和 
4fter 集 合 中 的 值 的 数量 。 

作为 第 一 步 ， 我 们 必需 替换 8efore 和 4fter 的 实现 。 之 前 它们 被 实现 成 任意 大 小 的 集合 ; 在 这 一 改 
进 的 模型 中 ， 寄 存 器 组 应 该 刚好 拥有 k 个 值 ， 其 中 k 是 可 以 用 来 存放 变量 值 的 寄存 器 数 。 下 一 步 ， 我 们 必 
须 重 写 产生 式 Facror 一 ident 的 规则 来 建 模 寄存 器 的 占有 状况 。 如 果 一 个 值 还 没有 被 装 入 ， 而 且 寄存 器 
是 可 用 的 ， 那 么 它 负责 这 一 简单 的 装 入 。 如 果 一 个 装 和 人 是 必须 的 ， 但 是 没有 可 用 寄存 器 ， 那 么 它 负 责 逐 
出 某 些 寄存 器 的 值 并 进行 这 一 装 入 。 选 择 逐 出 哪些 值 是 非常 复杂 的 ; 有 关 这 一 内 容 将 在 第 13 章 讨论 。 因 
为 4ssign 的 规则 总 是 负责 存储 ， 所 以 内 存 中 的 值 一 定 是 最 近 的 。 因 此 ， 当 一 个 值 要 被 逐 出 时 ,没有 存储 ”L184 
的 必要 。 最 后 ， 如 果 这 个 值 已 经 装 入 且 它 仍 在 寄存 器 中 ， 那 么 不 需要 代价 。 

这 一 模型 使 Factor 一 ident 的 规则 集合 变 复杂 ， 并 要 求 稍微 复杂 化 一 些 的 初始 条 件 (这 是 对 
Block 一 4ssign 的 规则 的 要 求 )。 然 而 ， 这 一 模型 没有 复杂 化 所 有 其 他 产生 式 的 拷贝 规则 。 因 此 ， 模 型 的 精 
确 性 没有 显著 增加 使 用 属性 文法 的 复杂 性 。 所 有 增加 的 复杂 性 只 局 限于 直接 处 理 这 一 模型 的 几 个 规则 。 


4.3.4 属性 文法 方法 的 问题 


前 面 的 例子 展示 在 使 用 属性 文法 执行 分 析 树 上 的 上 下 文 相关 计算 时 引发 的 很 多 计算 问题 。 其 中 的 一 
些 问题 形成 编译 器 中 属性 文法 使 用 的 特定 问题 。 特 别 地 ， 在 编译 器 前 端 大 多 数 属性 文法 的 使 用 中 都 假设 
属性 结果 必须 得 到 保存 ， 通 常 是 以 属性 分 析 树 的 形式 进行 保存 。 本 节 详 细 论 述 我 们 在 前 面 例 子 中 所 看 到 
的 问题 的 影响 。 
1. 处 理 非 局 部 信息 
一 些 问题 直接 反映 到 属性 文法 范式 ， 所 有 信息 以 相同 方向 传输 的 那些 问题 尤其 如 此 。 然 而 ， 带 有 复 
杂 的 信息 传输 模式 的 问题 很 难 表示 成 属性 文法 。 属 性 规则 只 能 定义 与 出 现 于 同一 产生 式 的 文法 符号 相关 
联 的 值 ， 这 迫使 规则 只 使 用 附近 或 局 部 的 信息 。 如 果 计 算 需 要 一 个 非 局 部 值 ， 那 么 属性 文法 必须 包含 能 
明确 地 把 这 些 值 拷贝 到 分 析 树 上 被 使 用 的 结 点 上 。 
这 些 拷 贝 规则 能 够 增 大 属性 文法 的 大 小 ; 将 图 4-7 与 图 4-8 和 图 4-9 做 比较 就 可 清楚 地 看 到 这 一 点 。 实 
现 者 必须 写 出 所 有 这 些 规则 。 在 评估 程序 中 ， 必 须 执 行 每 一 个 规则 ， 创 建新 属性 并 进行 额外 的 工作 。 当 
信息 是 被 整合 在 一 起 时 ， 就 如 在 使 用 前 声明 规则 或 估 测 执行 时 间 框架 中 那样 ， 每 当 规 则 改变 整合 值 都 需 [185] 
要 这 一 信息 的 一 份 新 拷贝 。 这 些 拷贝 规则 在 设计 和 评估 属性 文法 的 任务 中 又 增加 了 一 层 工作 。 


` 
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2. 存储 管理 

对 于 现实 的 例子 ,评估 产生 大 量 属 性 。 在 分 析 树 上 使 用 移动 信息 的 拷贝 规则 将 成 倍增 加 评估 所 创建 
的 属性 实例 的 数量 。 如 果 文 法 把 信息 聚集 成 复杂 的 结构 ， 例 如 在 分 析 树 上 传递 声明 信息 ， 那 么 各 个 属性 
就 会 很 大 。 评 估 程 序 必 须 为 属性 管理 存储 ; 不 好 的 存储 管理 框架 可 能 在 评估 程序 的 资源 需求 上 产生 不 成 
比例 的 巨大 的 负面 影响 。 

如 果 评 估 程 序 可 以 决定 哪些 属性 值 在 评估 后 可 以 使 用 的 话 ， 那 么 它 也 许 能 够 通过 回收 不 再 使 用 的 属 
性 值 空间 来 复 用 部 分 属性 存储 。 例 如 ， 将 表达 式 树 评估 为 一 个 值 的 属性 文法 也 许 把 这 个 值 返回 到 调用 这 
个 表达 式 的 过 程 中 。 在 这 样 的 情况 下 ， 在 内 部 结 点 处 计算 而 得 的 中 间 值 也 许 是 废弃 的 ， 即 不 再 使 用 ， 从 
而 也 就 成 了 回收 的 候选 。 另 一 方面 ， 如 果 关 于 属性 的 树 结果 需要 被 保留 且 在 以 后 需要 检查 ， 例 如 类 型 推 
断 的 属性 文法 的 情况 ， 那 么 评估 程序 必须 假设 编译 器 的 后 面 的 分 析 必 须 遍 历 树 并 检查 任意 属性 。 在 这 样 
的 情况 下 ， 评 估 程 序 不 能 回收 这 一 属性 任何 实例 的 存储 。 

(这 一 问题 实际 上 反映 了 属性 文法 范式 的 函数 性 本 质 与 在 编译 器 中 对 其 进行 命令 式 的 使 用 之 间 的 冲 
突 。 在 编译 器 的 后 面 阶段 对 属性 的 可 能 使 用 增加 了 属性 的 相关 性 ， 而 这 样 的 相关 性 是 在 属性 文法 中 没有 
加 以 描述 的 。 这 牌 曲 了 函数 范式 ， 丢 弃 了 它 的 一 个 强项 ， 即 自动 管理 属性 存储 的 能 力 .。) 

3. 实例 化 分 析 树 

属性 文法 描述 与 文法 上 合法 语句 的 分 析 树 相关 的 计算 。 这 一 范式 本 质 上 取决 于 分 析 树 的 可 用 性 。 评 
估 程 序 可 以 模拟 分 析 树 ， 但 是 它 必 须 当 作 分 析 树 存在 那样 行动 。 虽 然 分 析 树 对 分 析 的 讨论 很 有 用 ， 但 很 
少 有 编译 器 会 真正 构建 分 析 树 。 

有 些 编译 器 使 用 抽象 语法 树 (AST) 来 表示 被 编译 程序 。AST 具 有 分 析 树 的 本 质 结 构 ， 但 是 却 消除 
很 多 表示 文法 中 非 终结 符 的 内 部 结 点 (参见 5.3.1 节 )。 如 果 编 译 器 构建 AST， 那 么 它 可 以 使 用 依赖 于 
AST 文 法 的 属性 文法 。 然 而 ， 如 果 这 个 编译 器 在 其 他 方面 不 使 用 AST， 那 么 与 构建 并 维持 AST 相 关 的 程 
序 设计 努力 和 编译 时 代价 将 超过 使 用 属性 文法 形式 的 益处 。 

4. 定位 答案 

上 下 文 相关 分 析 的 属性 文法 框架 的 最 后 一 个 问题 更 加 微妙 。 属 性 评估 结果 是 一 棵 属性 树 。 分 析 的 
结果 以 属性 值 的 形式 散布 于 树 中 。 为 了 在 以 后 的 分 析 中 使 用 这 些 结果 ， 编 译 器 必须 遍历 树 来 定位 需要 
的 信息 。 

编译 器 可 以 使 用 细心 构建 的 遍历 来 定位 特定 结 点 ; 这 仍然 要 求 从 分 析 树 的 根 向 下 走 到 适当 的 位 置 ， 
每 一 次 处 理 都 需要 这 样 做 。 这 使 得 代码 既 慢 又 很 难 书写 ， 编 译 器 必须 执行 每 一 个 这 样 的 遍历 ， 而 且 编 译 
器 设计 者 必须 逐个 构造 它们 。 另 外 一 个 方法 是 把 重要 的 答案 拷贝 到 在 树 上 容易 被 发 现 一 个 点 上 ， 通 常 这 
一 点 是 根 。 这 将 导致 更 多 拷贝 规则 ， 使 这 一 问题 更 加 复杂 。 

5. 函数 范式 的 崩溃 

处 理 所 有 这 些 问 题 的 一 个 方法 就 是 添加 属性 的 中 心 存 储 室 。 在 这 样 的 情况 下 ， 属 性 规则 可 以 把 信息 
直接 记录 到 一 个 全 局 表 上 ， 在 这 个 表 上 可 以 读 取 信息 其 他 规则 。 这 一 混合 方法 可 以 消除 非 局 部 信息 所 引 
发 的 很 多 问题 。 因 为 这 一 全 局 表 可 以 被 任意 属性 规则 处 理 ， 它 具有 为 所 有 已 得 到 的 信息 提供 局 部 存 取 的 
效应 。 , 
添加 中 心 存储 室 从 另 一 方面 使 事情 复杂 化 。 如 果 两 个 规则 通过 某 种 机 制 而 不 通过 属性 规则 进行 沟通 
的 话 ， 那 么 二 者 之 间 隐 含 的 依赖 关系 就 从 属性 相关 图 中 消失 了 。 这 消失 的 相关 性 应 该 限制 评估 程序 来 保 
证 以 正确 的 顺序 处 理 这 两 个 规则 ; 没有 这 样 的 限制 的 话 , 评估 程序 就 可 能 构建 一 个 虽然 对 文法 是 正确 的 ， 


[187] 但 却 不 是 我 们 预期 的 行为 顺序 。 例 如 ， 如 果 使 用 一 个 表 在 声明 语法 与 可 执行 表达 式 之 间 传递 信息 ， 那 么 
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评估 程序 可 能 在 使 用 已 声明 变量 的 某 些 或 全 部 表达 式 之 后 处 理 该 声明 。 如 果 文法 使 用 拷贝 规则 传递 相同 
的 信息 ， 那 么 这 些 规 则 限制 评估 程序 ， 使 其 遵守 由 这 些 拷贝 规则 规定 的 相关 性 。 

6. 总 结 

属性 文法 并 非 是 每 一 个 上 下 文 相关 分 析 都 适合 的 抽象 。 属 性 文法 技术 的 倡导 者 们 认为 ， 属 性 文法 的 
问题 是 可 以 解决 的 ， 而 且 高 级 、 非 过 程 化 的 描述 的 优越 性 超过 了 它们 的 问题 。 然 而 ， 由 于 诸多 普遍 的 原 
因 ， 属 性 文法 方法 从 没有 得 到 广泛 的 流行 。 诸 如 执行 非 局 部 计算 的 困难 以 及 为 发 现 简单 问题 的 答案 而 必 
须 遍 历 分 析 树 等 重大 问题 阻碍 了 对 这 些 想 法 的 采用 。 诸 如 短 生 存 期 属性 的 空间 管理 、 评 估 程 序 的 效率 、 
缺乏 高 质量 、 廉 价 工具 等 诸多 小 问题 也 使 这 些 工 具 和 技术 缺乏 吸引 力 。 

尽管 如 此 ， 属 性 文法 范式 的 简洁 性 还 是 具有 吸引 力 的 。 如 果 能 够 把 属性 流传 输 方向 控制 到 单一 方向 ， 
或 者 是 合成 的 或 者 是 继承 的 ， 那 么 结果 属性 文法 就 很 简单 并 且 评估 程序 也 很 有 效 。 例 如 ， 这 一 范式 对 计 
算 器 或 解释 器 中 表达 式 的 评估 就 很 有 效 。 这 时 ， 值 的 传递 方向 是 沿 着 分 析 树 从 叶子 到 根 的 ， 所 以 规则 和 
评估 程序 都 是 直截了当 的 。 同 样 地 ， 只 涉 入 局 部 信息 的 应 用 通常 也 有 好 的 属性 文法 解决 方案 。 
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属性 文法 的 基于 规则 的 评估 程序 提出 一 个 强 有 力 的 思想 ， 这 一 思想 用 于 很 多 编译 器 的 上 下 文 相 关 分 
析 的 特定 技术 的 基础 。 在 基于 规则 的 评估 程序 中 ， 编 译 器 设计 者 描述 一 系列 与 文法 中 的 产生 式 相 关 的 动 
作 。 通 过 观察 可 知 ， 上 下 文 相关 分 析 所 需 的 动作 是 围绕 着 文法 的 结构 组 织 起 来 的 ， 这 导致 一 个 强 有 力 的 
特定 方法 ， 这 一 方法 把 这 种 分 析 与 分 析 上 下 文 无 关 文法 的 过 程 结 合 起 来 。 我 们 称 这 种 方法 为 特定 语法 制 
导 翻 译 (ad hoc syntax-directed translation ) 。 

在 这 一 方案 中 ， 编 译 器 设计 者 提供 在 语法 分 析 时 执行 的 代码 片段 。 每 一 个 片段 或 动作 (action) 直 
接 关 联 到 文法 中 的 一 个 产生 式 。 每 一 次 语法 分 析 器 识别 出 它 处 于 文法 中 的 某 个 特定 的 位 置 时 ， 它 便 调用 
相应 的 动作 来 执行 它 的 任务 。 为 了 在 自 顶 向 下 递归 下 降 分 析 器 中 实现 这 一 工作 ， 编 译 器 设计 者 只 是 把 适 
当 的 代码 加 入 到 分 析 程 序 中 。 编 译 器 设计 者 完全 控制 何 时 执行 动作 。 在 自 底 向 上 移入 归 约 分 析 中 ， 每 当 
语法 分 析 器 执行 一 个 归 约 动作 时 执行 动作 。 这 受到 更 多 的 限制 ， 但 是 仍然 是 可 行 的 。 

为 了 使 这 一 过 程 更 具体 ， 考 虑 在 特定 语法 制导 翻译 结构 中 重新 公式 化 带 符号 二 进 制 数 的 例子 。 图 4-10 
给 出 这 样 的 一 个 框架 。 每 一 个 文法 符号 有 一 个 与 其 相关 的 值 ， 在 代码 片段 中 记 作 va7。 每 一 个 规则 的 代码 
片段 定义 与 这 个 规则 左 部 符号 相关 的 值 。 规 则 1 简单 地 把 Sign 的 值 与 List 的 值 相 乘 。 规 则 2 和 规则 3 为 Sign 设 
置 适当 的 值 ， 正 如 规则 6 和 规则 7 为 Bz 的 每 一 个 实例 设置 值 一 样 。 规 则 4 把 BE 的 值 拷贝 到 Lisr 上 。 规 则 5 做 实 
际 的 工作 ， 这 一 规则 把 前 导 bit 的 累积 值 (List.val) 乘 以 2， 然 后 再 加 上 下 一 位 。 


产 生 式 代码 片段 
Number > Sign List |Numberval +- Sign.val x List.val 


Sign 一 十 Sign.val +- 1 

Sign 一 - Sign.val — -1 

List + Bit List.val + Bit.val 

Listo > List, Bit Listo.val + 2 x List,.val + Bit.val 
Bit +0 Bit.val + 0 

Bit 1 . Bit.val — 1 





图 4-10 带 符号 二 进 制 数 的 特定 语法 制导 翻译 
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至 此 ， 这 看 似 与 属性 文法 非常 相似 。 然 而 ， 这 一 过 程 存在 两 个 重要 的 简化 。 只 存在 一 个 方向 上 的 值 
传输 : 从 叶子 到 根 。 每 一 个 文法 符号 只 克 许 有 一 个 值 。 即 使 如 此 ， 图 4-10 中 的 方案 正确 计算 出 带 符号 二 
进 制 数 的 值 。 它 把 这 个 值 留 在 树 的 根部 ， 就 如 同 带 符号 二 进 制 数 的 属性 文法 一 样 。 

这 两 个 简化 使 该 评估 方法 得 以 与 自 底 向 上 分 析 器 ， 例 如 第 3 章 所 描述 的 LR 分 析 器 ， 很 好 地 配合 。 

因为 每 一 个 代码 片段 都 与 特定 产生 式 的 右 部 相关 ， 所 以 分 析 器 可 以 在 每 一 次 用 这 个 产生 式 进 行 归 约 
时 调用 它 的 动作 。 这 要 求 对 如 图 3-13 中 所 示 的 LR(1) 分 析 器 驱动 器 中 的 归 约 动作 做 微小 的 修改 。 


else if Action[s,word] = "reduce A-+8" then _ 
invoke the appropriate reduce action 
pop 2 x |8| symbols 
s + top of stack 
push A 
push Gotofs, A] 


SPAT ae AE RET LAAT fl FERRERA, ESV ERA BPE BAe SKI BR EE 
语句 中 ， 并 在 它 从 栈 中 弹出 产生 式 右 部 之 前 执行 这 个 选择 语句 。 

如 图 4-10 所 示 的 翻译 方案 比 用 于 解释 属性 文法 的 方案 简单 。 当 然 ， 我 们 可 以 写 出 运用 相同 策略 的 属 
性 文法 。 它 只 使 用 合成 属性 。 它 将 比如 图 4-4 所 示 的 文法 有 更 少 的 属性 规则 和 属性 。 我 们 选择 更 复杂 的 
属性 方案 来 展示 合成 和 继承 属性 的 使 用 。 


4.4.1 实现 特定 语法 制导 翻译 


为 了 使 特定 语法 制导 翻译 奏效 ， 语 法 分 析 器 必须 包含 这 样 的 机 制 : 把 一 个 动作 中 定义 的 值 传递 给 另 
外 一 个 动作 使 用 ， 提 供 方便 、 一 致 的 命名 ， 并 允许 在 分 析 过 程 中 的 其 他 点 处 执行 的 动作 。 本 节 描 述 自 底 
向 上 移入 归 约 分 析 器 中 处 理 这 些 问题 的 机 制 。 我 们 采用 YACC 系 统 所 使 用 的 表 记 法 ， 这 一 系统 是 随 Unix 
操作 系统 发 布 的 早期 、 流 行 的 LALR(1) 分 析 器 生成 器 。 许 多 后 期 系统 采用 YACC 表 记 法 。 


1. 动作 之 间 的 交流 

为 了 在 动作 之 间 传 递 值 ， 语 法 分 析 器 必须 有 配置 保存 各 个 动作 所 产生 的 值 的 空间 的 方法 。 这 一 机 制 
必须 使 动作 能 够 找到 它 所 使 用 的 值 。 属 性 文法 把 这 些 值 (属性 ) 与 分 析 树 中 的 结 点 联系 起 来 ; 将 属性 存 
储 与 树 结 点 存储 联系 起 来 ， 使 我 们 得 以 系统 地 找到 属性 值 。 在 特定 语法 制导 翻译 中 ， 语 法 分 析 器 可 以 不 
构建 这 样 的 分 析 树 。 相 反 ， 语 法 分 析 器 能 够 把 值 整 合 存储 到 它 自 身 的 机 制 中 以 跟踪 语法 分 析 的 状态 ， 这 
一 机 制 就 是 它 的 内 部 栈 。 

回顾 一 下 ， 框 架 LR(1) 分 析 器 为 每 一 个 文法 符号 在 栈 上 存储 两 个 值 : 符号 和 相应 的 状态 。 当 它 识 别 
句柄 ， 例 如 与 规则 5 的 右 部 匹配 的 List Bi 序列 时 ， 栈 上 的 第 一 对 值 表示 Bi。 其 下 面 的 一 对 值 表示 Zisr。 
我 们 可 以 用 三 元 组 <value， symbol，state> 取 代 <symbol，state>。 从 而 为 每 一 个 文法 符号 提供 单一 值 的 属 
性 ， 这 正 是 简化 方案 所 需要 的 。 为 了 管理 这 个 栈 ， 分 析 器 压 人 和 弹出 更 多 的 值 。 对 于 产生 式 4 一 。 的 归 
约 ， 它 从 栈 中 弹出 3 x | 有 个 位 置 ， 而 不 是 2 x |8| 个 位 置 。 它 压 人 值 连同 符号 和 状态 。 

这 一 方法 把 值 存放 于 相对 于 栈 顶 容易 计算 的 位 置 。 每 一 一 次 归 约 将 它 的 结果 作为 表示 左 部 的 三 元 组 的 
一 部 分 压 入 到 栈 中 。 动 作 从 栈 中 的 相对 位 置 读 取 右 部 的 值 ， 右 部 第 i 个 符号 的 值 在 从 栈 顶 数 第 个 三 元 组 
中 。 这 些 值 的 取 值 范围 是 固定 的 ; 在 实践 中 ， 这 一 限制 意味 着 我 们 应 该 使 用 指向 结构 的 指针 来 传递 更 复 
杂 的 值 。 

为 了 节省 存储 ， 语 法 分 析 器 可 以 在 栈 中 省 略 实际 的 文法 符号 。 语 法 分 析 所 需 的 必要 信息 被 编码 于 状 
态 中 。 这 可 以 缩小 校 ， 而 且 通 过 消除 压 人 和 弹出 这 些 符号 的 操作 来 加 速 分 析 。 另 一 方面 ， 文 法 符号 有 助 
于 语法 分 析 器 中 的 错误 报告 和 调试 。 这 一 权衡 通常 是 在 不 修改 工具 所 生成 的 语法 分 析 器 的 条 件 下 做 出 的 ， 
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因为 在 每 一 次 重新 生成 分 析 器 时 ， 必 须 再 一 次 进行 这 样 的 修改 。 

2. 命名 值 

为 了 简化 基于 栈 的 值 的 使 用 ， 编 译 器 设计 者 需要 为 它们 命名 的 表 记 法 。YACC 提 出 一 种 解决 这 一 问 
题 的 简洁 表 记 法 。 符 号 $3 表示 当前 产生 式 的 结果 位 置 。 因 此 ， 赋 值 33=0; 将 把 整数 值 0 作为 当前 归 约 的 
结果 压 和 人 到 栈 中 。 这 一 赋值 可 以 实现 图 4-10 中 规则 6 的 动作 。 对 于 规则 右 部 ， 符 号 81、82、…、8n 分 别 
表示 右 部 的 第 一 个 、 第 二 个 到 第 n 个 符号 的 位 置 。 

使 用 这 一 表 记 法 重 写 图 4-10 中 的 例子 产生 下 面 的 描述 : 


FER 代码 片段 
1 Number — Sign List $$< $1 x $2 
2 Signo+ $$] 
3 Sign 一 - $$ e -1 
4 List + Bit $$- $1 
5 Listy > List, Bit $$ — 2 x $1 + $2 
6 Bit>0 $$ 4- 0 
7 Bit1 $$- 1 


HEBRGHRESARE. 

这 一 方案 具有 高 效 的 实现 ; 符号 直接 翻译 成 距 栈 顶 的 偏 移 量 。 表 记 法 8 1 表示 位 于 从 栈 顶 往 下 第 3 x 
二 SHER, msi 表示 从 栈 顶 往 下 第 3 x (|B6| 一 i+1) 个 位 置 。 因 此 ， 这 一 位 置 表 记 法 允许 动作 片段 直接 读 写 
栈 中 的 位 置 。( 如 果 我 们 优化 语法 分 析 器 ， 使 其 不 压 人 实际 的 文法 符号 ， 那 么 乘 数 变 成 2 而 不 是 3。) 

3. 语法 分 析 其 他 点 处 的 动作 

编译 器 设计 者 也 可 能 需要 在 产生 式 中 间或 在 移入 动作 上 执行 一 个 动作 。 为 了 实现 这 一 点 ， 编 译 器 设 
计 者 可 以 对 文法 进行 转换 ， 使 其 在 需要 动作 的 每 一 点 执行 一 个 归 约 。 为 了 在 产生 式 中 间 进 行 归 约 ， 可 以 
将 在 应 该 执行 动作 之 处 把 产生 式 分 成 两 个 部 分 。 加 入 一 个 高 层次 的 产生 式 ， 将 第 一 个 部 分 和 第 二 个 部 分 
依次 连结 起 来 。 当 第 一 个 部 分 进行 归 约 时 ， 语 法 分 析 器 调用 这 一 动作 。 为 了 迫使 动作 在 移入 时 进行 ， 编 
译 器 设计 者 或 者 把 动作 移 到 扫描 器 进行 ， 或 者 加 入 一 个 产生 式 来 支持 这 一 动作 。 例 如 ， 为 了 在 移入 终结 
符 Bit 时 执行 一 个 动作 ， 编 译 器 设计 者 可 以 加 入 产生 式 : 

ShiftedBit — Bit 


并 用 ShiftredBit 取 代 Bit 的 每 一 次 出 现 。 从 而 为 每 一 个 终结 符 增 加 一 个 额外 的 归 约 。 因 此 ， 额 外 代价 直接 
与 程序 中 终结 符 的 数量 成 正比 。 ” l 


4.4.2 例子 


为 了 理解 特定 语法 制导 翻译 的 工作 方式 ， 考 虑 使 用 这 种 方法 重 写 执行 时 间 估 测 器 。 属 性 文法 解决 方 
案 的 主要 缺点 在 于 在 树 的 结 点 间 找 贝 信 息 的 规则 的 增殖 。 这 在 描述 中 生成 很 多 额外 的 规则 ， 并 在 很 多 结 
点 处 复制 属性 值 。 

为 了 使 用 特定 语法 制导 翻译 方案 来 描述 这 些 问 题 ， 编 译 器 设计 者 通常 为 变量 的 信息 引入 一 个 中 心 存 
储 室 ， 如 前 所 述 。 这 消除 在 树 的 结 点 间 拷 贝 值 的 必要 性 。 它 还 简化 继承 值 的 处 理 。 因 为 语法 分 析 器 决定 
评估 顺序 ， 我 们 无 需 担心 破坏 属性 间 的 相关 性 。 

大 多 数 编译 器 构建 和 使 用 这 样 的 一 个 存储 室 BARS A (symbol table )。 符 号 表 把 名 字 映 射 到 各 


.种 注释 ， 诸 如 类 型 、 运 行 时 表示 的 大 小 等 ， 以 及 生成 运行 时 地 址 所 需要 的 信息 。 符 号 表 还 存储 若干 类 型 
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相关 的 域 ， 诸 如 函数 的 类 型 署名 、 数 组 的 维 数 以 及 边界 等 。5.7 节 和 B.4 将 更 深入 讨论 符号 表 的 设计 。 

1. 再 论 装 入 跟踪 

再 一 次 考虑 作为 估 测 执行 代价 的 一 部 分 而 提出 的 跟踪 装 入 (load) 操作 的 问题 。 属 性 文法 中 这 一 问 
题 的 大 部 分 复杂 性 是 由 在 分 析 树 的 结 点 间 传送 信息 的 需要 引起 的 。 在 使 用 符号 表 的 特定 语法 制导 翻译 方 
案 中 ， 这 一 问题 变 得 容易 处 理 。 编 译 器 设计 者 可 以 在 这 一 表 中 设置 一 个 域 来 保存 表示 标识 符 是 否 已 被 装 
入 的 布尔 值 。 这 个 域 最 初 被 设置 为 fa1se。 关 键 代码 是 关于 产生 式 Factor 一 ident 的 代码 。 如 果 ident 的 
符号 表 条 目 表 明 还 没有 完成 装 和 信 ， 那 么 代价 被 更 新 ， 而 且 这 个 域 被 设置 为 true。 

图 4-11 给 出 这 一 情况 ， 它 还 包括 所 有 其 他 动作 。 因 为 这 些 动作 可 以 包含 任意 代码 ， 所 以 编译 器 可 以 


把 cost 累 积 在 一 个 变量 中 ， 而 不 是 在 分 析 树 的 每 一 个 结 点 处 创建 一 个 cost 属 性 。 


产 生 式 语法 制导 动作 


Block, Assign 

Assign 

Identifier = Expr; { cost = cost + Cost(store) } 
Expr, + Term { cost = cost + Cost(add) } 
Expr, - Term { cost = cost + Cost(sub) } 
Term 

Term, x Factor { cost = cost + Cost(mult) } 


Term, + Factor { cost = cost + Cost(div) } 
Factor 
Factor ( Expr ) 


num { cost = cost + Cost(loadI) } 


ident { if ident’s symbol table field 
indicates that it has not been loaded 
then 
cost = cost + Cost(1 oad); 
set the field to true } 








图 4-11 使 用 特定 语法 制导 翻译 跟踪 装 人 


对 于 最 简单 的 执行 模型 ， 这 一 方案 比 属 性 规则 需要 更 少 的 动作 ， 尽 管 属 性 规则 可 以 为 更 复杂 模型 提 
供 精 确 性 。 

注意 ， 有 几 个 产生 式 没有 动作 。 除 iden 引 发 的 归 约 上 的 动作 外 ， 其 余 的 动作 是 简单 的 。 由 跟踪 装 入 
引发 的 所 有 复杂 性 都 落 入 这 一 动作 中 ; 这 与 属性 文法 方案 中 的 动作 不 同 ， 在 那里 Before 和 After 集 合 间 
的 传送 任务 支配 着 描述 。 特 定语 法 制导 翻译 更 清楚 、 更 简单 ， 这 部 分 是 因为 这 一 问题 非常 适合 于 由 移入 
归 约 分 析 器 中 的 归 约 动作 所 指定 的 评估 顺序 。 当 然 ， 编 译 器 设计 者 必须 实现 这 一 符号 表 ， 或 从 某 一 数据 
结构 实现 的 程序 库 中 导入 符号 表 。 | 

当然 ， 其 中 的 某 些 策略 也 可 以 运用 于 属性 文法 框架 。 然 而 ， 它 违反 属性 文法 的 功能 属性 。 它 迫使 这 
一 工作 的 某 些 重要 部 分 脱离 属性 文法 框架 而 进入 特定 的 设置 。 

图 4-11 的 方案 忽视 一 个 关键 问题 : 初始 化 cost。 正如 所 看 到 的 那样 ， 这 一 文法 不 包含 可 以 把 cost 适 
当初 始 化 为 0 的 产生 式 。 如 前 所 述 ， 这 一 问题 的 解决 方案 是 修改 文法 ， 使 其 生成 一 个 初始 化 的 地 方 。 
个 初始 产生 式 ， 如 Start 一 Costinait Block， 还 有 CostInit->e 就 可 以 完成 这 一 工作 。 这 一 框架 在 从 到 
Costynit 的 归 约 上 执行 赋值 coste-0。 
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2. 重 探 表达 式 的 类 型 推断 
推断 表达 式 类 型 的 问题 适合 于 属性 文法 框架 ， 只 要 我 们 假设 叶 结 点 总 是 有 类 型 信息 即 可 。 如 图 4-6 
所 示 这 一 问题 的 解答 的 简洁 性 来 自 于 两 个 主要 事实 。 第 一 ， 因 为 表达 式 类 型 是 递归 地 定义 于 表达 树 上 的 ， 
信息 的 自然 流向 自 底 向 上 从 叶 向 根 传输 。 这 使 其 倾向 于 5- 属 性 文法 的 解决 方案 。 第 二 ， 表 达 式 类 型 是 使 
用 源 语言 语法 定义 的 。 这 也 同样 适合 于 属性 文法 框架 ， 因 为 这 隐 式 地 要 求 分 析 树 的 存在 。 所 有 类 型 信息 
都 可 以 与 文法 符号 的 实例 相关 联 ， 而 文法 符号 精确 地 对 应 于 分 析 树 上 的 结 点 。 
如 图 4-12 所 示 ， 我 们 可 以 在 特定 语法 制导 翻译 的 框架 下 重新 公式 化 这 一 问题 。 结 果 框 架 看 起 来 类 似 
于 同一 目的 的 如 图 4-6 所 示 的 结果 。 这 一 特定 框架 并 没有 为 这 一 问题 提供 真正 的 益处 。 195 


生 式 语法 制导 动作 


Expr + Term { $$<- F + ($1, $3) } 
Expr — Term { $§ — F —($1,$3) } 
Term { $$— $1} 

Term x Factor { $$ — F x ($1,$3) } 


Term + Factor { $$ — F +($1,$3) } 
Factor { $$ — $7 } 

( Expr) { $$ — $2} 

num { $$ + type of the num } 
ident { $$ + type of the ident } 








图 4-12 推断 表达 式 类 型 的 特定 语法 制导 翻译 框架 


3. 构建 抽象 语法 树 
编译 器 前 端 必须 为 程序 构建 一 个 中 间 表 示 以 供 编译 器 的 中 间 部 分 及 后 端 使 用 。 抽 象 语 法 树 是 树 结构 
IR 的 一 个 通用 形式 (参见 5.3.1 节 )。 构 建 AST 的 任务 非常 适合 于 特定 语法 制导 翻译 框架 。 
假设 编译 器 有 一 系列 命名 为 MakeNpde, 的 过 程 ， 其 中 0 < i< 3。 过 程 取 惟 一 识别 文法 符号 的 常量 为 它 
的 第 一 个 参数 ， 新 结 点 将 表示 这 一 文法 符号 。 其 余 i 个 参数 是 i 棵 子 树 的 根 结 点 。 因 此 ，MakeNode。 
(number) 构造 一 个 叶 结 点 并 标示 它 表 示 一 个 num。 同 样 地 ， 196 
MakeNode2(Plus,;MakeNode (number), MakeNodeg(number)) 


构建 一 个 以 p17us 为 根 并 带 有 两 个 子 结 点 的 AST， 其 中 每 一 个 子 结 点 是 num 的 叶 结 点 9 。 

为 了 构建 抽象 语法 树 ， 特 定语 法 制导 翻译 框架 遵循 下 面 两 个 一 般 原则 : 

1) 对 于 一 个 操作 符 ， 它 创建 一 个 以 每 个 操作 数 为 子 结 点 的 结 点 。 因 此 2+3 为 + 创建 一 个 二 又 结 点 ， 
且 结 点 2 和 3 是 它 的 子 结 点 。 

2) 对 于 一 个 无 用 产生 式 ， 如 Term 一 Factor， 它 复 用 Facror 的 动作 结果 为 它 自己 的 结果 。 

按 这 一 方式 ， 它 避免 构建 表示 语法 变量 的 树 结 点 ， 如 Factor、Term 和 Expr 等 。 图 4-13 给 出 具体 表现 
这 些 思 想 的 语法 制导 翻译 方案 。 

4. 生成 表达 式 的 ILOC 

作为 处 理 表达 式 的 最 后 一 个 例子 ， 考 虑 生成 ILOC 而 不 是 AST 的 特定 框架 。 我 们 将 做 几 个 简化 假设 。 


O 过 程 Makewode' 可 以 用 任意 合适 的 方式 实现 树 。 例 如 ， 它 们 可 以 把 这 一 结构 映射 到 一 棵 二 叉 树 上 。 参 见 B.31 
节 中 的 讨论 。 . 
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这 一 例子 只 局 限于 整数 ; 处 理 其 他 类 型 只 会 增加 复杂 性 而 不 能 有 助 于 我 们 的 理解 。 这 一 例子 还 假设 所 有 
值 都 可 以 存放 于 寄存 器 中 : 这 些 值 可 以 适合 寄存 器 的 大 小 ， 而 且 ILOC 实 现 提供 的 寄存 器 多 于 计算 使 用 
的 寄存 器 。 


E A 语法 制导 动作 

Expr + Term { $$ — MakeNodez (plus, $1, $3); 
$type — F + ($1.type, $3.type) } 

Expr — Term { $$ — MakeNode2(minus, $1, $3); 
$$type — F — ($1.type $3.type) } 

Term { $$« $1} 

Term x Factor { $$ MakeNode.(times, $1, $3); 
$Stype — F x ($1.type, $3.type) } 

Term =~ Factor { $$ MakeNode2(divide, $1, $3); 
$type — F + ($1.type $3.type) } 

Factor { $$ — $1 } 

( Expr) { $$ $2} 

num { $$ — MakeNodey (number); 
$text + scanned text; 
$type < type of the number } 

{ $$ — MakeNode (identifier); 

$$text — scanned text; 
$$type + type of the identifier } 


N 





图 4-13 构建 抽象 语法 树 并 推断 表达 式 类 型 


代码 生成 要 求 编译 器 跟踪 很 多 细节 。 为 了 把 这 些 籍 记 细节 抽象 掉 〈 并 把 一 些 更 深层 的 问题 推迟 到 以 
后 的 章节 )， 这 一 例子 的 框架 使 用 四 个 支援 过 程 。 

1) Address 取 一 个 变量 名 作为 它 的 参数 并 返回 一 个 寄存 器 号 码 。 它 保证 该 寄存 器 包含 这 一 变量 的 地 
址 。 如 果 必 要 的 话 ， 它 生成 计算 这 一 变量 地 址 的 代码 。 

2) Emit 处 理 创建 各 个 ILOC 操 作 的 具体 表示 的 细节 。 它 也 许 按 特定 格式 把 它们 打印 成 文件 。 或 者 ， 
它 也 可 能 为 以 后 使 用 构建 一 个 内 部 表示 。 

3) NextRegister 返 回 一 个 新 寄存 器 号 码 。 一 个 简单 的 实现 可 能 是 递增 一 个 全 局 计数 器 。 

4) Wa1ue 取 一 个 数 作为 它 的 参数 并 返回 一 个 寄存 器 号 码 。 它 保证 该 寄存 器 包含 作为 参数 的 数 。 如 果 
有 必要 ， 它 生成 将 这 个 数 移 到 寄存 器 中 的 代码 。 

图 4-14 给 出 这 一 问题 的 语法 制导 框架 。 这 些 动作 通过 在 分 析 栈 中 传递 寄存 器 名 来 通信 。 在 必要 时 这 
些 动作 把 这 些 名 字 传 送 到 Emit 来 创建 实现 输入 表达 式 的 操作 。 

5. 处 理 声 明 

当然 ， 编 译 器 设计 者 可 以 使 用 语法 制导 的 动作 填充 属于 符号 表 的 大 部 分 信息 。 例 如 ， 图 4-15 所 示 的 
文法 片段 描述 C 语 言 的 变量 声明 的 一 部 分 语法 。( 它 忽略 类 型 定义 (typedef). ty (struct), KA 
(union)、 类 型 修饰 词 const 、restrict 和 volatile 以 及 初始 化 语法 的 细节 。 它 还 留 下 若干 没有 详细 描述 
的 非 终结 符 。) 考虑 为 每 个 变量 声明 构建 符号 表 条 目 所 需 的 动作 。 每 个 Declaration 开 始 于 一 个 或 多 个 描 
述 变 量 类 型 和 存储 类 型 的 修饰 词 。 这 些 修饰 词 后 面 跟随 由 一 个 或 多 个 变量 名 组 成 的 序列 ; 每 一 个 变量 名 
可 以 包含 关于 间接 (一 个 或 多 个 * 的 出 现 )、 关 于 数组 维 数 以 及 关于 变量 初始 值 等 的 描述 。 
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语法 制导 动作 


{ $$ — NextRegister; 
Emit(add, $1,$3, $$) 
{ $$ + NextRegister; 
Emit(sub, $1, $3, $$) 
{ $$ $7 } 


{ $$ — NextRegister; 
Emit(mukt $1, $3, $$) 

{ $$ — NextRegister; 
Emit(div, $1, $3, $$) 

{ $$ $1} 

{ $$+ £2} 

{ $$ + Value(scanned text); } 

{ $$ ¢ Address(scanned text); } 


图 4-14 为 表达 式 发 行 ILOC 


DeclarationList 


Declaration 
SpecifierList 


Specifier 


StorageClass 


InitDeclaratorList 
InitDeclarator 
Declarator 
Pointer 


DirectDeclarator 


` 


一 一 一 一 一 一 一 一 一 一 1 


DeclarationList Declaration 
Declaration 

SpecifierList InitDeclaratorList ; 
Specifier SpecifierList 
Specifier 

StorageClass 

TypeSpecifier 

auto 

static 

extern 

register 

void 


_ char 


short 
int 
long 
signed 


unsigned 
float 
double 


InitDeclaratorList , InitDeclarator 
InitDeclarator ` 
Declarator = Initializer 
Declarator 

Pointer DirectDeclarator 
DirectDeclarator 

* 

* Pointer 

ident 

( Declarator ) 

DirectDeclarator ( ) 
DirectDeclarator ( ParameterTypeList ) 
DirectDeclarator ( IdentifierList ) 
DirectDeclarator [ ] 
DirectDeclarator [ ConstantExpr ] 





图 4-15 C 语 言 声明 语法 的 子 集 
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例如 ，StroageClass 产 生 式 允 许 程 序 员 描 述 有 关 变 量 值 生存 期 的 信息 ; auto 变 量 的 生存 期 与 声明 它 
的 块 的 生存 期 一 致 ， 而 static 变 量 的 生存 期 是 程序 的 整个 执行 期 间 。register 说 明 符 建议 编译 器 该 值 应 
该 保存 在 能 够 快速 存 取 的 位 置 ， 即 硬件 寄存 器 上 。extern 说 明 符 告知 编译 器 不 同 编译 单元 中 相同 名 字 的 

声明 需要 作为 一 个 对 象 来 链接 。 

编译 器 必须 保证 每 一 个 被 声明 的 名 字 至 多 有 一 个 存储 类 型 属性 。 文 法 将 说 明 符 放置 在 由 一 个 或 多 个 
名 字 的 序列 之 前 。 编 译 器 在 处 理 说 明 符 时 可 以 把 它们 记录 下 来 ， 并 在 后 来 过 到 这 些 名 字 了 时 对 这 些 名 字 运 
用 该 说 明 符 。 文 法 容许 任意 多 个 StroageClass 和 TypeSpecifier 关 键 字 ; 语言 的 标准 限制 实际 关键 字 可 以 结 
合 的 方式 9S。 例如 ， 每 个 声明 只 允许 有 一 个 StorageClass。 编 译 器 必须 通过 上 下 文 相关 检测 来 支持 这 一 
限制 。 类 似 的 限制 适用 于 TypeSpecifer。 例 如 ，short 和 int 在 一 起 是 合法 的 ， 而 和 f1oat 在 一 起 是 不 合 
法 的 。 

为 了 处 理 声 明 ， 编 译 器 必须 从 限定 符 收集 属性 ， 增 加 任意 的 间接 、 维 数 或 初始 化 属性 ， 并 将 变量 加 
入 表 中 。 编 译 器 设计 者 也 许 设置 一 个 性 质 结 构 ， 这 一 性 质 结构 的 域 与 符号 表 条 目的 域 相 匹配 。 在 一 个 
Declaration 的 最 后 ， 它 可 以 初始 化 这 一 结构 中 每 个 域 的 值 。 当 它 归 约 声明 语法 中 的 各 产生 式 时 ， 它 可 以 
相应 调整 这 一 结构 中 的 值 。 

。 在 auto 到 StorageClass 的 归 约 上 ， 编 译 器 检测 存储 类 型 域 是 否 还 没有 被 设置 ， 然 后 ， 把 这 个 域 设置 

ee 对 static、 extern fined ster aE eB BFA RIES 


关于 上 下 文 相关 文法 


通过 前 几 章 所 给 出 的 思想 的 发 展 ， 似 乎 很 自然 地 去 考虑 使 用 上 下 文 相 关 语 言 来 执行 上 下 文 相关 
检测 ， 例 如 类 型 推断 。 总 之 ， 我 们 使 用 正则 语言 执行 词法 分 析 ， 使 用 上 下 文 无 关 语言 执行 语法 分 析 。 
一 个 自然 的 发 展 也 许 提出 对 上 下 文 相关 语言 和 它们 的 文法 的 研究 。 上 下 文 相关 文法 表示 的 语言 系列 
. 比 上 下 文 无 关 文 法 所 能 表示 的 语言 系列 更 大 。 


然而 ， 由 于 两 个 不 同 原因 ， 上 下 文 相关 文法 不 是 正确 的 答案 。 首 先 ， 分 析 上 下 文 相关 文法 的 问 
题 是 P 空 间 完 全 的 。 因 此 ， 使 用 这 样 的 技术 的 编译 器 会 非常 慢 。 其 次 ， 很 多 重要 问题 即使 不 是 不 可 
能 ， 也 是 非常 难以 使 用 上 下 文 相关 文法 来 描绘 。 例 如 ， 考 虑 使 用 前 声明 的 问题 。 将 这 一 规则 写成 上 
下 文 相 关 文 法 将 需要 这 一 文法 描绘 声明 变量 的 每 一 种 不 同 的 组 合 。 如 果 名 字 空 间 是 够 小 (例如 ， 
Dartmouth BASIC 将 名 字 限 制 为 单一 字母 或 一 个 字母 后 面 跟着 可 选 的 一 个 数字 ) ， 这 也 许 是 可 行 的 ; 
使 用 巨大 名 字 空 间 的 现代 语言 中 ， 名 字 集合 大 得 无 法 使 用 上 下 文 相关 文法 描绘 。 





。 从 ident 到 DirectDeclarator 的 归 约 将 引发 一 个 为 该 名 字 创 建 符号 表 新 条 目 并 将 性 质 结构 的 当前 设置 
拷贝 到 这 一 条 目 中 的 动作 。 
“通过 产生 式 

InitDeclaratorList > InitDeclaratorList , InitDeclarator 


的 归 约 可 以 重 置 与 特定 名 字 相 关 的 性 质 域 ， 包 括 由 Pointer、Initializer 和 DirectDeclarator 产 生 式 所 
设置 的 性 质 域 。 


日 ”这 种 类 型 的 限制 可 以 在 文法 上 实现 。 标 准 的 制定 者 不 选 译 以 这 种 方式 处 理 它 。 增 加 这 种 限制 将 使 已 经 很 大 
的 文法 更 加 复杂 。 因 为 编译 器 必须 在 TypeSpecifier 的 组 合 上 跟踪 类 似 的 限制 ， 所 以 在 语法 之 外 进行 这 样 的 检 
测 的 负荷 较 小 。 
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通过 在 声明 语法 的 这 些 产 生 式 间 协调 一 系列 动作 ， 编 译 器 设计 者 可 以 确保 在 处 理 每 个 名 字 时 性 质 结 
构 都 包含 适当 的 设置 。 

当 语 法 分 析 器 完成 构建 DeclararionList 的 工作 时 ， 它 已 为 在 当前 作用 域 声明 的 每 一 个 变量 构建 符号 
表 的 一 个 条 目 。 此 时 ， 语 法 分 析 器 也 许 需要 执行 某 些 常规 杂 务 ， 诸 如 给 已 声明 变量 指派 存储 位 置 等 。 这 
一 工作 可 以 由 归 约 DeclararionList 的 产生 式 的 动作 来 完成 。 如 果 有 必要 的 话 ， 可 以 分 解 这 个 产生 式 ， 创 
建 执行 这 一 动作 的 合适 位 置 。 l 


45 高 级 话题 


本 章 介绍 了 类 型 理论 的 基本 概念 ， 并 把 它们 作为 属性 文法 框架 和 特定 语法 制导 翻译 的 启示 性 例子 。 
对 类 型 理论 的 更 深层 的 处 理 和 它 的 运用 需要 一 整 本 书 来 讨论 。 

本 节 第 一 小 节 展示 一 些 影响 编译 器 执行 类 型 推断 和 类 型 检测 方式 的 语言 设计 问题 。 第 二 小 节 探 讨 实 
践 中 出 现 的 若干 问题 ， 在 构建 中 间 表 示 的 过 程 中 重新 安排 计算 。 


4.5.1 ”类 型 推断 中 的 较 难 问题 


强 类 型 化 静态 检测 语言 可 以 通过 寻找 大 部 分 错误 程序 而 帮助 程序 员 生 成 合法 的 程序 。 同 样 地 ， 揭 示 
错误 的 特征 可 以 增进 编译 器 通过 取消 运行 时 检测 来 生成 高 效 代 码 的 能 力 ， 同 时 揭示 出 编译 器 在 何 处 可 以 
对 某 些 结构 成 份 特 化 特定 情况 、 消 除 运行 时 不 可 能 出 现 的 情况 。 这 些 事实 部 分 导致 在 现代 程序 设计 语言 
中 类 型 理论 的 作用 日 趋 重要 。 

然而 ， 我 们 的 例子 做 了 并 非 在 所 有 程序 设计 语言 中 都 成 立 的 假设 。 例 如 ， 我 们 假设 变量 和 过 程 都 被 
声明 ， 程 序 员 为 每 一 个 名 字 写 下 紧凑 、 形 成 一 个 整体 的 描述 。 改 变 这 些 假设 可 能 从 根本 上 改变 类 型 检测 
问题 的 性 质 以 及 编译 器 在 实现 语言 时 可 用 的 策略 的 性 质 。 

一 些 程序 设计 语言 或 者 省 略 声明 ， 或 者 把 声明 当 作 可 选 的 信息 。Scheme 程 序 缺 少 变 量 声明 。 
Smalltalk 程 序 声明 类 ， 但 是 只 有 当 程 序 实例 化 一 个 对 象 时 ， 才 决定 这 个 对 象 的 类 。 支 持 独立 编译 的 语言 ， 
也 就 是 可 以 独立 地 编译 过 程 并 在 链接 时 把 它们 结合 起 来 形成 程序 的 语言 ， 也 许 对 独立 编译 的 过 程 不 要 求 
声明 。 

在 没有 声明 的 情况 下 ， 类 型 检测 更 加 困难 ， 因 为 编译 器 必须 取决 于 上 下 文 线索 来 决定 每 个 名 字 的 合 
适 类 型 。 例 如 ， 如 果 i 被 用 做 茶 个 数组 a 的 下 标 ， 这 也 许 迫 使 具有 数字 类 型 。 这 一 语言 也 许 只 允许 整数 
下 标 ; 另外 ， 它 也 可 能 允许 可 以 转换 到 整数 的 任意 类 型 。 

通常 可 以 用 语言 定义 来 描述 类 型 规则 。 这 些 规则 的 特定 细节 决定 它 为 每 一 个 变量 推断 类 型 的 难 易 程 
度 。 因 而 ， 这 对 编译 器 用 于 实现 语言 的 策略 有 直接 的 影响 。 

1. 类 型 相 容 运用 及 固定 函数 类 型 

考虑 一 个 需要 变量 和 函数 的 相 容 运用 的 无 声明 语言 。 这 时 ， 编 译 器 可 以 为 每 个 名 字 指 定 一 个 一 般 类 
型 ， 然 后 通过 名 字 在 上 下 文 的 使 用 来 缩小 类 型 。 例 如 ，x<y*3.14159 这 样 的 语句 揭示 x 和 y 是 数 ，x 必 须 
上 共有 允许 存放 小 数 的 类 型 。 如 果 y 还 出 现 于 期 望 整数 的 上 下 文中 ， 例 如 出 现 于 数组 引用 a(y) H, WAA 
译 器 必须 在 非 整数 (对 于 y*3.14159) 和 整数 (对 于 a(y)) 间 做 出 选择 。 无 论 选 择 的 结果 如 何 ， 都 需要 
对 其 中 的 一 个 运用 进行 类 型 转换 。 

如 果 函 数 具 有 已 知 且 固定 的 返回 类 型 ， 即 一 个 总 是 返回 相同 类 型 的 函数 ， 那 么 编译 器 可 以 在 使 用 类 
型 构成 的 格 上 运用 迁 代 不 动 点 算法 来 对 类 型 推断 间 题 求解 。 

2. 类 型 相 容 运用 及 不 知 函 数 类 型 

如 果 一 个 函数 的 类 型 因 函 数 的 参数 而 发 生变 化 ， 那 么 类 型 推断 间 题 就 变 得 更 加 复杂 。 例 如 ， 在 
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Scheme 中 就 有 这 样 的 问题 。Scheme 的 库 过 程 map 取 一 个 函数 和 一 个 列表 为 参数 。 它 返回 将 这 一 函数 参数 
运用 于 列表 的 每 一 个 元 素 所 得 的 结果 。 也 就 是 说 ， 如 果 和 参数 函数 取 类 型 a 一 8， 那 么 map 的 类 型 为 a 的 列 
表 到 PB 的 列表 9S 。 我 们 将 它 的 类 型 署名 写作 : 

map: (a+) x list ofa — list of 8 


因为 map 的 返回 类 型 依赖 于 它 的 参数 类 型 (这 称 为 参数 多 态 性 ) ， 推 断 规则 必须 包括 类 型 空间 上 的 等 式 。 
(等 式 包含 已 知 、 固 定 的 返回 类 型 和 在 类 型 空间 上 取 返 回 值 的 函数 。) 由 于 这 一 情况 ， 简 单 的 迭代 不 动 点 
类 型 推断 是 不 够 的 。 

检测 这 些 更 复杂 体系 的 经 典 方 法 依赖 于 单一 化 ， 尽 管 精明 的 类 型 体系 设计 和 类 型 表示 可 以 使 用 更 简 
单 或 更 有 效 的 技术 。 


3. 类 型 中 的 动态 变化 

如 果 变 量 的 类 型 在 执行 期 间 可 以 改变 ， 也 许 要 求 其 他 策略 去 发 现 类 型 在 何 处 发 生变 化 ， 并 推断 正确 
的 类 型 。 理 论 上 ， 编 译 器 可 以 重新 命名 变量 使 得 每 一 个 定义 对 应 惟一 的 名 字 。 然 后 ， 编 译 器 可 以 基于 定 
义 每 一 个 名 字 的 操作 所 提供 的 上 下 文 来 为 这 些 名 字 推 断 类 型 。 

为 了 成 功 地 推断 类 型 ， 这 样 的 体系 需要 处 理 代码 中 的 一 些 点 ， 不 同 控 制 流 路 径 的 汇集 导致 不 同 的 定 
义 必须 在 这 些 点 处 合并 。 就 如 静态 单一 赋值 形式 中 的 函数 那样 (参见 5.5 节 和 9.3 节 )。 如 果 这 一 语言 包 
含 参数 多 态 化 ， 那 么 类 型 推断 机 制 也 必须 处 理 它 。 

实现 带 有 动态 改变 类 型 的 语言 的 经 典 方法 是 回 到 解释 的 方案 。Lisp、Scheme、Smalltalk 和 APL 都 有 
类 似 问 题 。 这 些 语言 的 标准 实现 实践 包括 解释 操作 符 ， 使 用 数据 类 型 给 数据 指定 标签 ， 并 在 运行 时 检查 
类 型 错误 。 

在 APL 中 ， 程 序 员 很 容易 写 出 这 样 一 个 程序 ， 其 中 a x b 在 第 一 次 执行 时 是 整数 乘法 ， 而 在 下 一 次 则 
是 浮 点 数 多 维 数 数组 的 乘法 。 这 导致 对 于 消去 的 检测 和 对 于 动作 的 检测 的 实质 性 研究 。 最 好 的 APL 体 系 
回避 不 成 熟 的 解释 器 所 需 的 大 部 分 检测 。 
45.2 ”更改 结合 性 

正如 我 们 在 3.6.4 节 中 所 看 到 的 那样 ， 在 数字 计算 中 结合 性 可 以 造成 很 大 的 不 同 。 同 样 地 ， 它 可 以 改 
变 构 建 数据 结构 的 方式 。 我 们 可 以 使 用 语法 制导 动作 构建 反映 与 文法 自然 生成 的 结合 性 不 同 的 结合 性 的 
表示 。 . 

一 般 地 ， 左 递归 文法 自然 生成 左 结合 性 ， 而 右 递 归 文 法 自然 生成 右 结合 性 。 为 了 看 到 这 一 点 ， 考 虑 
图 4-16 上 部 的 左 递归 列表 文法 和 右 递归 列表 文法 ， 其 中 还 加 入 了 建立 列表 的 语法 制导 动作 。 与 每 一 个 产 
生 式 相关 联 的 这 些 动 作 构建 列表 的 表示 。 假 设 L(X，yY) 是 列表 构造 器 ， 它 可 被 实现 成 MakeNode,( cons， 
X，y)。 图 4-16 的 下 部 给 出 将 两 个 翻译 方案 运用 到 由 五 个 e1t 组 成 的 输入 的 结果 。 

在 很 多 方面 ， 这 两 棵 树 是 等 价 的 。 两 棵 树 的 中 序 遍 历 以 相同 的 顺序 访问 叶 结 点 。 如 果 我 们 加 上 括号 
来 反映 树 的 结构 ,那么 左 递归 树 是 ((((elt,，elt;)，eit:)，elt)，etts)， 而 右 递归 树 是 (ett;，(elt，， 
(elt，，(e1it。，elts))))。 左 递归 所 产生 的 顺序 对 应 于 代数 操作 符 的 经 典 从 左 到 右 顷 序 。 右 递归 所 产生 
的 顺序 对 应 于 Lisp 和 Scheme 中 的 列表 的 表 记 法 。 

有 了 时， 对 递归 和 结合 性 使 用 不 同 的 方向 很 方便 。 为 了 从 左 递归 文法 构建 右 递归 树 ， 我 们 可 以 使 用 把 
相继 的 元 素 加 到 列表 末端 的 构造 器 。 这 一 思想 的 直接 实现 必 将 对 每 一 次 归 约 遍历 列表 ， 对 于 长 度 为 "的 
列表 ， 构 造 器 本 身 的 时 间 复 杂 度 就 是 O(n*)。 为 了 避免 这 样 的 额外 开销 ， 编 译 器 可 以 生成 含有 指向 这 一 列 


O map 也 可 以 处 理 含 多 个 参数 的 函数 。 为 了 做 到 这 一 点 ， 它 取 多 个 参数 列表 并 把 它们 依次 作为 各 参数 的 列表 。 
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表 中 的 第 一 个 结 点 和 最 后 一 个 结 点 的 指针 的 列表 头 结 点 。 这 对 每 个 列表 导 和 一 个 额外 的 结 点 。 如 果 系 统 
构造 很 多 短 列表 ， 这 一 额外 开销 可 能 成 为 问题 。 


文 法 动 作 文 法 a 作 


List > List elt { 88 © L($1,£2)} List > elt List {$$ — L(81,82)} 
| elt {多 e- $1) | elt {38 e $1} 


elts elt; 
elt, elt, 
elt; elt; 
elt, elt, elt, elt; 


左 递归 右 递归 








图 4-16 递归 与 结合 性 的 比较 


一 个 特别 吸引 人 的 解决 方案 是 在 构建 期 间 使 用 列表 头 结 点 ,并 在 列表 构建 完成 以 后 丢弃 这 一 头 结 点 。 
使 用 产生 式 重 写 文法 就 会 使 这 一 方案 清楚 地 出 现在 我 们 的 面前 。 


文 法 动 作 
List > e€ { $$ + MakeListHeader() } 
| Listelt { $$ + AddToEnd($1,$2) } 
Quux 一 List { $$ + RemoveListHeader($1) } 


使 用 se 产生 式 的 归 约 创建 临时 列表 头 结 点 ; 使 用 移入 归 约 分 析 器 ， 这 一 归 约 首先 出 现 。 产 生 式 
List>List 8&1t 调 用 构造 器 ， 它 取决 于 临时 头 结 点 的 存在 。 当 在 任意 其 他 产生 式 的 右 部 的 List 被 归 约 时 ， 
相应 的 动作 调用 丢弃 临时 头 结 点 并 返回 列表 第 一 个 元 素 的 函数 。 

这 一 方法 使 得 语法 分 析 器 能 够 在 空间 和 时 间 上 以 小 常量 额外 开销 的 代价 反 转 结合 性 。 这 一 方法 对 每 
个 列表 要 求 一 个 额外 的 由 a 产生 式 引 发 的 归 约 。 修 改 后 的 文法 接受 空 表 ， 而 原来 的 文法 不 接受 空 表 。 为 
了 弥补 这 一 差异 ，RemoveListHeader 可 以 显 式 地 检测 空 表 并 报告 错误 。 


4.6 概括 和 展望 


在 第 2 章 和 第 3 章 中 ,我 们 已 看 到 编译 器 前 端 中 的 很 多 工作 可 以 自动 进行 。 正则 表达 式 对 词法 分 析 很 
有 效 。 上 下 文 无 关 文法 对 语法 分 析 很 有 效 。 在 本 章 中 ， 我 们 考察 了 两 种 执行 上 下 文 相关 分 析 的 方法 : 属 
性 文法 形式 和 一 个 特定 方法 。 对 于 上 下 文 相 关 分 析 ， 与 扫描 和 语法 分 析 不 同 ， 形 式 方法 还 不 能 取代 这 一 
特定 方法 。 

使 用 属性 文法 的 形式 方法 为 书写 产生 适当 高 效 可 执行 的 高 级 描述 带 来 了 希望 。 尽 管 属性 文法 不 是 上 
下 文 相关 分 析 中 每 一 个 问题 的 解决 方案 ， 它 们 已 在 从 定理 证 明 器 到 程序 分 析 等 若干 领域 得 到 了 应 用 。 如 
果 问 题 中 的 属性 流 主要 是 局 部 的 话 ， 属 性 文法 可 以 很 好 地 工作 。 用 属性 文法 处 理 使 用 一 种 属性 可 以 完整 
刻画 的 问题 ， 无 论 是 合成 属性 还 是 继承 属性 ， 通 常 都 可 以 产生 清晰 、 直 观 的 解决 方案 。( 当 我 们 需要 使 
用 拷贝 规则 沿 树 指引 属性 的 流向 时 , ) 我 们 可 能 就 到 了 走出 属性 文法 的 函数 范式 ， 来 到 引入 中 心 存储 室 
的 时 候 了 。 

特定 技术 ，、 语 法 制导 翻译 把 任意 的 代码 片段 整合 在 语法 分 析 器 中 ， 并 让 语法 分 析 器 来 安排 动作 序列 
及 在 它们 之 间 传 值 。 由 于 这 一 方法 有 很 大 的 灵活 性 ， 并 且 很 多 分 析 器 生成 器 系统 都 包含 该 方法 ， 这 人 一方 
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法 已 得 到 广泛 的 拥护 。 这 一 特定 方法 回避 非 局 部 属性 流 以 及 管理 属性 存储 的 需要 所 引发 的 各 种 实际 问题 。 
值 沿 着 它 的 状态 的 语法 分 析 器 内 部 表示 的 方向 传输 (就 自 底 向 上 分 析 器 的 合成 值 和 自 顶 向 下 分 析 器 的 继 
承 值 而 言 )。 这 些 方案 使 用 全 局 数据 结构 在 其 他 方向 上 传送 信息 并 处 理 非 局 部 属性 流 。 

在 实践 中 ， 编 译 器 设计 者 通常 尝试 同时 解决 若干 问题 ， 诸 如 构建 中 间 表 示 ， 推 断 类 型 并 指定 存储 位 
置 。 这 倾向 于 创建 许多 两 个 方向 上 的 属性 流 ， 迫 使 实现 者 采纳 使 用 诸如 符号 表 等 的 中 心 存储 室 存 储 事实 
的 特定 解决 方案 。 在 一 遍 中 解决 多 个 问题 的 理由 通常 是 编译 时 的 效率 。 然 而 ， 在 不 同 的 遍 中 解决 问题 通 
常 可 以 产生 更 容易 理解 、 更 容易 实现 且 更 容易 维护 的 解决 方案 。 

本 章 作为 编译 器 必须 执行 的 上 下 文 相 关 分 析 的 一 个 例子 介绍 了 类 型 系统 背后 的 思想 。 类 型 理论 和 类 
型 系统 设计 的 研究 本 身 是 具有 重要 学 术 意义 的 活动 ， 同 时 具有 这 和 的 学 术 探 讨 。 本 章 只 粗略 地 概述 了 类 
型 推断 和 类 型 检测 等 表面 问题 ， 更 深层 的 研究 问题 则 超出 了 本 章 的 范畴 。 在 实践 中 ， 编 译 器 设计 者 需要 
彻底 研究 源 程序 的 类 型 系统 ， 并 详细 地 工程 化 类 型 推断 和 类 型 检测 的 实现 。 本 章 的 内 容 只 是 一 个 开始 ， 
实际 的 实现 需要 更 深入 的 研究 。 


本 章 注释 


从 最 初 的 FORTRAN 编 译 器 开始 ， 类 型 系统 就 已 成 为 程序 设计 语言 的 一 个 不 可 或 缺 的 部 分 。 虽 然 最 
早 的 类 型 系统 反映 机 器 的 资源 ， 但 不 久 就 在 诸如 Algol 86 和 Simula 67 中 出 现 了 对 于 类 型 系统 具有 重要 意 
义 的 抽象 。 类 型 系统 理论 几 十 年 来 得 到 了 积极 的 研究 ， 产 生 一 系列 包含 重要 原则 的 语言 。 这 些 包括 
Russell [43] (参数 多 态 性 )，CLU [239] (抽象 数据 类 型 ) Smalltak [157] (继承 子 类 型 ) 和 ML [258] 
(彻底 而 完整 地 将 类 型 作为 第 一 类 对 象 )。Cardelli 给 出 了 类 型 系统 的 精彩 纵览 [64] 。APL 组 织 发 表 了 一 系 
207| ” 列 研 究 消除 运行 时 检测 技术 的 经 典 文章 [1，32，257，331]。 
与 计算 机 科学 中 的 很 多 思想 一 样 ， 属 性 文法 是 由 Knuth [218，219] 首 先 提 出 来 的 。 关 于 属性 文法 的 
文献 集中 研究 了 评估 器 [193 ，327]、 循 环 检测 [327] 以 及 属性 文法 的 应 用 [132，287]。 属 性 文法 充当 了 若 
干 成 功 系统 的 基础 ， 包 括 Intel 80286 的 Pascal 编 译 器 [135，136]、Cornell 程 序 合成 器 [286] 以 及 合成 器 生 
成 器 [188，288]。 
特定 语法 制导 翻译 业已 成 为 实际 的 语法 分 析 器 开发 的 一 部 分 。Irons 通 过 将 语法 分 析 器 的 动作 从 语法 
描述 分 离 出 来 描述 了 语法 制导 翻译 背后 的 基本 思想 [191]。 毫 无 疑问 ， 同 样 的 基本 思想 在 语法 制导 分 析 器 
出 现 之 前 就 被 用 于 手工 编码 优先 顺序 分 析 器 。 我 们 所 描述 的 编写 语法 制导 动作 的 风格 是 由 Johnson 在 
YACC 中 引入 的 [195]。 同 样 的 表 记 法 也 已 进军 当前 的 系统 中 ， 包 括 Gnu 项 目的 bison。 


第 5 章 
中 间 表 示 


5.1 概述 


正如 我 们 所 看 到 的 那样 ， 编 译 器 被 组 织 成 一 系列 的 遍 ， 其 中 每 一 遍 扮 演 着 不 同 的 角色 。 这 样 的 结构 
导致 对 被 编译 代码 的 中 间 表示 的 需求 。 因 此 ， 编 译 器 必须 使 用 某 种 内 部 形式 ， 即 中 间 表 示 或 I{R 来 表示 被 
分 析 和 被 翻译 的 代码 。 大 多 数 遍 消耗 IR; 绝 大 多 数 遍 生成 IR。 很 多 编译 器 在 编译 过 程 中 使 用 多 个 IR。 在 
这 样 的 方案 中 ， 中 间 表 示 成 为 主要 的 或 决定 性 的 代码 表示 。 

为 了 实现 这 一 工作 ，IR 必 须 有 足够 的 表示 能 力 来 记录 编译 器 各 遍 之 间 传 输 的 所 有 有 用 事实 。 在 翻译 
期 间 ， 编 译 器 得 到 源 代码 中 没有 表示 的 各 种 事实 ， 例 如 变量 和 过 程 的 地 址 等 。 典 型 地 ， 编 译 器 为 IR 配 置 
记录 额外 信息 的 一 组 表格 。 我 们 将 这 些 表 格 考 虑 成 民 的 一 部 分 。 

在 算法 设计 中 ， 必 须 在 线 解决 的 问题 与 可 以 离线 解决 的 问题 之 间 有 着 关键 的 区 别 。 通 常 编译 器 离线 
工作 ， 也 就 是 说 ， 它 们 可 以 对 被 翻译 代码 做 多 遍 处 理 。 对 代码 做 多 遍 处 理 可 以 改善 编译 器 所 生成 的 代码 
的 质量 。 编 译 器 可 以 在 若干 遍 中 汇集 信息 ， 并 使 用 这 些 信 息 在 后 面 的 遍 中 做 出 决定 。 

为 编译 器 设计 选择 适当 的 开 需 要 对 源 语言 和 目标 计算 机 的 理解 以 及 编译 器 要 编译 的 程序 的 性 质 的 理 
解 。 因 此 ， 一 个 源 语言 到 源 语言 的 翻译 器 可 能 以 相当 接近 源 语言 的 形式 保持 它 的 内 部 信息 。 相 反 ， 为 微 
控制 器 产生 汇编 代码 的 编译 器 也 许 使 用 与 目标 计算 机 的 指令 集合 接近 的 内 部 形式 。 

设计 特定 的 人 R 需 要 考虑 编译 器 必须 记录 、 分 析 和 处 理 的 信息 种 类 。 因 此 ，C 语 言 的 编译 器 需要 有 关 
指针 值 的 额外 信息 ， 而 在 Perl 编 译 器 中 则 不 需要 这 样 的 信息 。 同 样 地 ，Java 编 译 器 需要 有 关 类 的 层次 结 
构 的 信息 ， 而 在 C 语 言 的 编译 器 中 却 没 有 相应 的 信息 。 

最 后 ， 实 现 一 个 IR 迫 使 编译 器 设计 者 考察 若干 实践 上 的 因素 。IR 应 该 为 执行 编译 器 经 常 使 用 的 操作 
提供 廉价 的 方法 。IR 应 该 有 表示 编译 过 程 中 产生 的 结构 的 完整 组 织 紧凑 方法 。 最 后 ，IR 的 实现 应 该 为 纺 
译 器 设计 者 提供 能 够 直接 而 简单 地 检查 IR 程 序 的 机 制 。 

编译 器 设计 者 绝 不 应 忽视 这 最 后 一 点 。IR 的 清晰 且 可 读 的 外 部 形式 本 身 就 是 有 价值 的 。 有 了 时， 可 以 
通过 增加 语法 来 改进 可 读 性 。ILOC 中 的 一 符号 就 是 一 个 例子 。 它 除了 帮助 读者 把 结果 和 操作 数 分 离开 
来 之 外 没有 其 他 目的 。 


5.2 分 类 法 - 


为 了 组 织 我 们 对 IR 的 考虑 ， 我 们 应 该 认识 到 在 我 们 设置 特定 的 设计 时 存在 着 两 条 主线 。 第 一 ，IR 有 
一 个 结构 化 的 组 织 。 大 体 说 来 ，IR 可 以 归 类 于 三 个 组 织 范畴 : 

e A® (graphical) IR 以 图 的 形式 描绘 编译 器 的 信息 。 以 结 点 和 边 、 列 表 或 树 的 形式 表示 算法 。 第 3 

章 中 用 于 描述 派生 的 分 析 树 是 一 种 图 表 式 IR。 

e 线性 (linear) IR 类 似 于 某 种 抽象 计算 机 的 伪 代 码 。 算 法 在 简单 、 线 性 的 操作 序列 上 迭代。 本 书 所 

使 用 的 ILOC 代 码 就 是 一 种 线性 IR。 
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RAR (hybrid) IRER HARIR HERERO ARER, A A ETIE REIR RAHA EN 

它们 的 弱点 。 一 个 普通 的 混合 型 表示 使 用 低级 线性 及 表示 直线 代码 块 ， 使 用 图 形 表示 各 代码 块 间 

的 控制 流 。 

IR 的 结构 化 组 织 对 编译 器 设计 者 如 何 考 虑 分 析 、 优 化 和 代码 生成 有 很 大 的 影响 。 例如 ， 树 型 开 自 然 
导致 把 它们 的 操作 嵌入 到 某 种 树 遍 历 的 遍 。 同 样 地 ， 线 性 IR 自 然 导 致 在 对 所 有 指令 进行 线性 扫描 过 程 中 
进行 操作 的 遍 。 

IR 分 类 法 的 第 二 条 主线 是 I 表示 操作 的 抽象 层次 。 它 的 范围 从 以 一 个 结 点 表示 过 程 调用 的 贴近 源 语 
言 的 表示 ， 直 到 必须 将 若干 IR 操 作 组 合 起 来 才能 表示 一 个 目标 机 器 操作 的 非常 低级 的 表示 。 

为 了 说 明 其 可 能 性 ， 考 虑 编译 器 是 如 何在 源 语 言 级 树 和 ILOC 中 表示 引用 A[i，j] 的 。 假 设 A 是 二 维 
数组 ， 且 每 一 维 有 十 个 元 素 。 
1oadI 1 => r 
sub rj, rn > rz 
loadI 10 > 73 
mult r2, 3 > ra 
sub ri, r > rs 
add rq, r's = rs 
loadI @A => 7 
add ory, re > re 





load rg = TA; 


ILOC 代 码 


在 源 语言 级 AST 中 ， 编 译 器 可 以 轻松 地 识别 出 计算 是 一 个 数组 引用 ; 检查 低级 代码 ， 我 们 发 现 简单 
的 事实 也 相当 含混 不 清 。 当 编译 器 试图 决定 两 个 不 同 引用 何 时 可 能 接触 同一 内 存 位 置 时 ，AST 的 高 抽象 
度 可 能 是 很 有 价值 的 。 相 比 之 下 ， 将 上 面 的 低级 代码 识别 为 一 个 数组 引用 是 很 难 的 ， 特 别 是 当 形 已 进行 
了 优化 ,而 优化 把 若干 操作 移 到 了 过 程 的 其 他 部 分 ， 或 者 消除 了 一 些 代码 时 ， 识 别 就 更 加 困难 了 。 另 一 


源 代码 级 树 


- 方面， 如 果 编 译 器 正在 优化 为 数组 地 址 计算 而 生成 的 代码 ， 那 么 低级 代码 揭示 出 在 AST 中 是 隐藏 着 的 操 


作 。 在 这 种 情况 下 ， 较 低级 的 抽象 可 以 为 地 址 计算 生成 更 高 效 的 代码 。 

高 级 抽象 并 非 树 型 IR 的 固有 性 质 ， 它 隐 式 地 存在 于 分 析 树 的 表 记 法 中 。 然 而 ， 低 级 表达 式 树 已 被 很 
多 编译 器 用 来 表示 诸如 ALi ，j] 的 地 址 计算 等 计算 的 所 有 细节 。 同 样 地 ， 线 性 IR 可 以 有 相当 高 级 的 结构 。 
例如 ， 很 多 线性 IR 都 包含 把 串 到 串 拷 贝 编码 成 一 个 操作 的 字 节 拷贝 操作 。 

在 菜 些 简单 的 RISC 机 器 上 ， 最 好 的 串 拷 贝 编码 包含 清除 整个 寄存 器 单元 和 一 个 做 多 字 存 储 跟着 一 
个 多 字 装 和 人 的 循环 上 的 选 代 。 需 要 某 些 基 本 的 逻辑 来 处 理 校 正和 重 登 串 的 特殊 情况 。 通 过 使 用 一 个 指 
令 表示 这 一 复杂 操作 ， 编 译 器 设计 者 可 以 使 优化 器 更 容易 地 把 找 贝 移出 循环 或 发 现 这 一 拷贝 是 元 余 的 。 
在 编译 的 后 期 阶段 ， 一 个 指令 被 适当 地 扩展 成 执行 拷贝 或 对 执行 拷贝 的 某 个 系统 程序 或 库 程序 的 调用 的 
代码 。 

生成 和 处 理 IR 的 代价 应 该 是 编译 器 设计 者 关心 的 问题 ， 因 为 这 些 直 接 影响 编译 器 的 速度 。 不 同 鞍 需 
要 的 数据 空间 的 变化 范围 很 广 。 因 为 编译 器 通常 要 涉及 所 有 被 分 配 的 空间 ， 数 据 空间 通常 与 执行 时 间 有 
直接 关系 。 为 了 使 这 一 讨论 更 加 具体 ， 考 虑 用 于 我 们 在 Rice 大 学 构建 的 两 个 不 同 研究 系统 中 的 JIR 。 

。R" 程 序 设计 环境 为 FORTRAN 构 建 抽象 语法 树 。 树 中 每 个 结 点 占据 92 个 字 节 。 分 析 器 对 FORTRAN 

的 每 一 个 源 代码 行 平均 构建 11 个 结 点 ， 因 此 对 每 一 个 源 代码 行 ， 其 大 小 刚好 超过 1 000 个 字 节 。 

。 由 我 们 小 组 所 生成 的 研究 用 编译 器 使 用 ILOC 的 完整 实现 。( 本 书 中 的 ILOC 是 它 的 一 个 简单 子 集 。) 

一 个 ILOC 操 作 占 据 23 到 25 个 字 节 。 这 一 编译 器 对 每 一 源 代 码 行 平均 生成 大 约 15 个 ILOC 操 作 。 优 
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化 把 这 一 数字 降低 到 对 每 一 个 源 代码 行 平均 生成 刚刚 超过 3 个 ILOC 操 作 。 

最 后 ， 编 译 器 设计 者 应 该 考虑 IR 的 表示 能 力 ， 也 就 是 它 为 编译 器 提供 记录 所 需 事 实 的 能 力 。 这 其 中 
包含 定义 过 程 的 一 系列 动作 ， 以 及 静态 分 析 的 结果 ， 前 次 运行 的 简 档 以 及 调试 器 所 需 的 信息 等 。 这 些 信 
息 的 表示 应 该 使 它们 与 开 中 的 特殊 点 间 的 关系 清晰 可 见 。 


5.3 图 示 IR 


很 多 阴 用 图 形 表示 被 翻译 代码 。 在 概念 上 ， 所 有 图 示 IR 都 是 由 结 点 和 边 组 成 的 。 它 们 之 间 的 差异 在 
于 图 与 源 语言 程序 之 间 的 关系 以 及 图 的 结构 上 。 


5.3.1 与 语法 相关 的 树 


第 3 章 展示 的 分 析 树 是 表示 程序 的 源 代 码 形式 的 图 。 很 多 编译 器 使 用 树 型 IR ， 其 中 的 树 结构 对 应 于 
源 代 码 的 语法 。 
1. 分 析 树 
有 时 被 称 为 语法 树 (syntax tree) 的 分 析 树 (parse tree) 是 对 应 于 输入 程序 的 派生 或 分 析 的 图 形 表 
示 。 图 5-1 的 左边 给 出 文法 ， 右 边 给 出 x x 2+X x 2 x y 的 分 析 树 。 它 表示 完整 的 派生 ， 每 一 个 结 点 表示 派 
生 中 的 一 个 文法 符号 。 编 译 器 必须 为 每 一 个 结 点 和 每 一 条 边 分 配 内 存 。 同 样 地 ， 编 译 器 将 数 次 遍历 所 有 
结 点 和 边 。 因 此 ， 值 得 考虑 压缩 分 析 树 的 方法 。 


Goal 一 Expr 

Expr 一 Expr + Term 
Expr — Term 
Term 


Term x Factor 
Term + Factor ' Term x Factor 


Factor 


Term x Factor Term X Factor <ident,y> 
(Expr) | of | 
num Factor <num,2> Factor <num,2> 
ident 


<ident,x> <ident,x> 


经 典 表 达 式 文法 xx2+Xxx2xy 的 分 析 树 





图 5-1 使 用 经 典 表达 式 文 法 的 分 析 树 


如 3.7.1 节 所 述 ， 文 法 上 的 微小 转换 可 以 消除 派生 中 的 某 些 步 最 以 及 它们 对 应 的 语法 树 结 点 。 更 有 效 
的 技术 是 利用 抽象 剔 出 在 编译 器 的 余下 部 分 中 没有 实质 目的 的 那些 结 点 。 这 一 方法 导致 分 析 树 的 一 个 简 
化 形式 。 l 
分 析 树 主要 用 于 语法 分 析 和 属性 文法 系统 的 讨论 中 ， 在 那里 分 析 树 是 主要 IR。 在 需要 源 代码 级 树 的 ”|[213 
其 他 应 用 中 ， 编 译 器 设计 者 倾向 于 使 用 在 本 节 其 余部 分 描述 的 更 紧凑 的 形式 。 
2. 抽象 语法 树 
抽象 语法 树 (abstract syntax tree, AST) 保留 分 析 树 的 本 质 结构 而 消除 无 关 结 点 。 表 达 式 的 优先 度 
和 意义 仍然 保留 着 ， 而 无 关 的 结 点 已 不 再 出 现 。 
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+ 
po N 
x x 
YN ZN 
x 2 x y 
x 2 
xx 2+X x 2 x y 的 抽象 语法 树 


AST 是 一 种 贴近 源 代码 级 的 表示 。 因 为 它 大 致 对 应 于 分 析 树 ， 在 分 析 器 中 很 容易 建立 (参见 4.4.2 节 )。 

AST 运 用 于 很 多 实际 的 编译 器 系统 。 包 括 程序 设计 环境 及 自动 并 行 化 工具 在 内 的 源 语言 到 源 语言 系 
统一 般 都 依赖 于 AST， 从 AST 可 以 容易 地 重新 生成 源 代码 。( 这 一 过 程 通常 被 称 为 优质 打印 (pretty 
printing) ; 它 在 对 AST 的 中 序 遍历 过 程 中 重新 生成 源 代 码 文本 。) 在 Lisp 中 的 S- 表 达 式 和 Scheme 的 实现 
本 质 上 是 AST。 

即使 当 AST 是 被 用 作 贴近 源 代码 级 的 表示 时 ， 所 选择 的 特定 表示 和 所 使 用 的 抽象 也 都 是 需要 考虑 的 
问题 。R" 程 序 设计 环境 使 用 下 图 左 子 树 来 表示 FORTRAN 中 的 complex 常 量 ， 记 作 (ci，cz)。 这 一 选择 
适合 于 语法 制导 编辑 器 ， 在 此 程序 员 可 以 独立 地 改变 cy 和 cz; pair 结 点 对 应 于 括号 和 逗号 。 


C1 C2 . (cl,cz) 


编辑 的 AST 编译 的 AST 


然而 ， 这 一 抽象 对 编译 器 来 说 是 有 问题 的 。 处 理 常 量 的 编译 器 的 每 一 个 部 分 都 需要 包含 处 理 复 常量 
的 特定 选择 代码 。 其 他 常量 都 有 包含 指针 的 一 个 constant 结 点 ， 指 针 指向 记录 在 表 中 的 文本 串 。 编 译 器 
也 许 使 用 如 上 图 的 右边 所 示 的 复 常量 表示 会 更 好 些 。 它 可 以 通过 消除 很 多 特定 选择 代码 来 简化 编译 器 。 

在 必须 表示 源 代 码 级 信息 的 系统 中 抽象 语法 树 有 广泛 的 用 途 。 这 些 包 括 基 于 语言 的 编辑 器 、 源 代码 
到 源 代码 翻译 器 以 及 解释 程序 。 很 多 编译 器 以 AST 为 IR; 抽象 的 等 级 既 可 以 很 高 也 可 以 很 低 。 如 果 编 译 
器 以 另外 一 个 程序 设计 语言 作为 它 的 输出 目标 ， 那 么 AST 通 常 具 有 相当 高 级 别 的 抽象 。 在 为 某 种 目标 机 


器 生成 汇编 代码 的 编译 器 中 ， AST 的 最 终 版 本 通常 是 处 于 机 器 指令 集 的 抽象 等 级 或 在 其 等 级 之 下 。 













存储 效率 和 图 示 表示 


很 多 实际 系统 使 用 抽象 语法 树 表示 被 翻译 的 源 代 码 文 本 。 在 这 些 系统 中 所 遇 到 的 一 个 共同 问题 
”是 相对 于 输入 文本 的 AST 的 大 小 。 巨 大 的 数据 结构 会 限制 这 些 工具 能 够 处 理 的 程序 的 大 小 。 

R" 程 序 设计 环境 中 的 AST 结 点 非常 大 ， 足 以 给 20 世 纪 80 年 代 工作 站 的 有 限 内 存 系统 提出 问题 。 | 
树 的 磁盘 W/O 成 本 减 慢 了 所 有 R" 工 具 。 | 

导致 AST 大 小 的 急剧 增加 的 原因 是 多 样 的 。R" 只 有 一 种 结 点 ， 这 使 得 结 点 结构 包含 所 有 结 点 所 
需 的 所 有 域 。 这 简化 了 结 点 分 配 ， 但 是 却 增加 了 结 点 的 大 小 。( 大 致 有 一 半 的 结 点 是 叶 结 点 ， 它 们 | 
不 需要 指向 子 结 点 的 指针 。) 在 其 他 系统 中 ， 结 点 伴随 编译 器 中 各 遍 所 使 用 的 多 种 较 小 的 额外 域 的 | 
增加 而 生长 。 有 时 候 ， 每 当 增加 新 的 特性 和 遍 时 ， 结 点 的 大 小 随 之 增加 。 | | 

对 AST 的 内 容 和 形式 加 以 关注 可 以 缩小 它 的 大 小 。 在 R" 中 ， 我 们 构建 了 分 析 AST 内 容 和 AST 的 | 
使 用 状况 的 程序 。 我 们 把 某 些 域 结合 起 来 而 消除 另外 一 些 域 。( 在 某 些 情况 下 ， 重 新 计算 信息 要 比 
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读 写 它 更 廉价 。) 在 少数 情况 下 ， 我 们 使 用 散 列 链表 记录 不 常用 的 事实 ， 即 ， 使 用 存储 每 个 结 点 类 | 


型 的 域 中 的 一 位 来 表明 散 列 链表 中 存在 额外 的 信息 。( 这 避免 了 分 配 那 些 很 少 使 用 的 域 . ) 为 了 在 磁 


盘 上 记录 AST， 我 们 通过 前 序 遍 历 树 把 AST 转 换 成 线性 表示 ; 这 消除 了 记录 任意 内 部 指针 的 必要 性 。 


在 R" 中 ， 把 所 有 这 些 技 术 结 合 起 来 可 以 使 AST 在 内 存 中 的 大 小 减 小 约 75%。 在 磁盘 上 ， 在 移 走 | 
指针 后 ， 文 件 的 大 小 大 约 是 它们 的 内 存 表示 大 小 的 一 半 。 这 些 变化 使 尺 可 以 处 理 更 大 的 程序 并 使 工 | 
具 更 加 迅速 。 | 

3. 有 向 无 环 图 

尽管 AST 比 语法 树 更 紧凑 ， 但 是 它 却 忠实 地 保留 了 原来 的 源 代码 的 结构 。 例 如 ，x x 2+x x 2 x y 的 AST 

包含 表达 式 x x 2 的 两 个 不 同 拷贝 。 有 向 无 环 图 (directed acyclic graph, DAG) 是 避免 这 一 复制 的 AST 的 

缩写 形式 。 在 DAG 中 ， 结 点 可 以 有 多 个 父 结 点 ， 相 同 的 子 树 被 复 用 。 这 使 得 DAG 比 相应 的 AST 更 紧凑 。 
对 于 没有 赋值 的 表达 式 ， 文 本 上 相同 的 表达 式 必须 产生 相同 的 值 。x x 2+x x 2 x y 的 DAG 反 映 了 只 

使 用 x x 2 的 一 个 拷贝 的 事实 ， 如 下 所 示 。 


N, 
IZN 
aa 


这 个 DAG 在 它 的 形状 中 描绘 了 这 一 表达 式 的 一 个 明确 提示 。 如 果 在 x x 2 的 两 次 使 用 之 间 x 的 值 不 发 
生变 化 ， 那 么 编译 器 可 以 生成 评估 子 树 一 次 而 使 用 该 结果 两 次 的 代码 。 这 将 为 整个 表达 式 带 来 更 好 的 代 
码 。 然 而 ,编译 器 必须 证 明 这 个 x 的 值 不 改变 。 如 果 表 达 式 既 不 包含 赋值 也 不 包含 对 其 他 过 程 的 调用 ， 
那么 上 述 事 实 的 证 明 很 简单 。 因 为 无 论 是 赋值 还 是 过 程 调用 都 可 能 改变 与 某 个 名 字 相 关 的 值 ， 当 子 树 的 
操作 数 发 生变 化 时 ， 这 个 DAG 结 构 必 须 使 子 树 无 效 。 我 们 将 在 8.3.1 节 中 对 DAG 结 构 加 以 描述 。 

在 实际 系统 中 使 用 DAG 有 两 个 原因 。 有 些 系统 受益 于 DAG 的 较 小 内 存 使 用 。 特 别 是 内 存 约束 通常 限 
制 编 译 器 处 理 的 程序 大 小 。DAG 有 助 于 减 小 这 一 限制 。 其 他 系统 使 用 DAG 揭 示 可 能 的 元 余 。 这 里 ， 其 效 
益 在 于 更 好 的 编译 代码 。 这 些 系 统 倾向 于 把 DAG 用 作 衍 生 IR: 构建 DAG ， 转 换 衍生 了 ， 然 后 丢弃 DAG。 

4. 抽象 的 级 别 . 

我 们 所 有 的 树 的 例子 都 给 出 与 源 代码 非常 相近 的 树 。 也 可 以 使 用 树 来 表示 代码 中 低级 别 的 细节 。 事 
实 上 ， 优 化 和 代码 生成 的 基于 树 的 技术 可 能 需要 这 样 的 细节 。 举 个 例子 ， 考 虑 语句 we 一 x-2 x y。 源 代码 
级 的 AST 以 简明 的 形式 描述 这 一 语句 ， 如 下 所 示 : 


AN, 
A N N 
八 UN 
a ! o] 
2 y Z/N ZN 


ram -16 @G 12 
源 代 码 级 AST 低级 AST 





~ 





N 


N 
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然而 ， 源 代码 级 树 缺 少 把 这 一 语句 翻译 成 汇编 代码 所 需 的 很 多 节 细 。 如 上 图 右边 所 示 的 低级 树 可 以 使 得 
这 些 细节 清晰 可 见 。 这 一 树 引 入 四 个 新 结 点 类 型 。val 结 点 表示 已 在 寄存 器 中 的 值 。num 结 点 表示 已 知 的 
常量 。1ab 结 点 表示 汇编 级 标签 ， 典 型 地 是 一 个 可 重 定位 符号 。 最 后 ， 争 是 解除 引用 一 个 值 的 运算 符 ; 
它 把 这 个 值 当 作 一 个 内 存 地 址 并 返回 在 那个 地 址 处 的 内 存 内 容 。 

这 一 低级 树 展示 与 这 三 个 变量 有 关 的 地 址 计算 。w 被 存储 在 离 rar* 中 的 指针 偏 移 为 4 的 地 方 ，rar 存 放 
指向 当前 过 程 的 数据 域 的 指针 。xS 的 双重 解除 引用 表明 它 是 一 个 引用 形式 的 形 参 ， 可 以 透 过 存储 于 在 
rsrp 之 前 16 个 字 节 的 指针 存 取 。 最 后 ，y 被 存储 在 标签 @6 之 后 偏 移 为 12 的 地 方 。 

注意 w 评 估 到 一 个 地 址 ， 因 为 它 是 赋值 语句 的 左 部 。 与 此 相反 ， 由 于 操作 符 令 ，x 和 y 都 评估 到 值 。 


5.3.2 图 


尽管 树 为 在 分 析 过 程 中 所 发 现 的 源 代码 的 文法 结构 提供 一 种 自然 的 表示 ， 但 是 它们 的 呆板 结构 使 得 
它们 对 表示 程序 的 其 他 性 质 用 处 不 大 。 为 了 建 模 程序 行为 的 这 些 方面 ， 编 译 器 通常 以 更 一 般 的 图 为 IR 。 
在 前 面 一 节 中 引入 的 DAG 就 是 图 示 芒 的 一 个 例子 。 

1. 控制 流 图 

控制 流 图 (control-flow graph, CFG) 模型 化 程序 中 控制 的 流向 。CFG 是 一 个 有 向 图 ，G=(N，E)。 
每 一 个 结 点 nEN 对 应 于 一 个 基本 块 (basic block)。 基 本 块 是 总 在 一 起 执行 的 操作 序列 。 控 制 总 是 从 基本 
块 的 第 一 个 操作 进入 该 基 本 块 并 从 它 的 最 后 一 个 操作 离开 。 每 一 个 边 e= (n;，n)EE 对 应 于 从 块 i 到 块 的 
控制 的 可 能 转移 。 

为 了 简化 第 8 章 和 第 9 章 中 的 程序 分 析 的 讨论 ， 我 们 假设 每 一 个 CFG 有 惟一 的 入口 点 m 和 惟一 的 出 口 
点 六。 在 一 个 过 程 的 CFG 中 ，m 对 应 于 这 个 过 程 的 人 口 点 。 如 果 过 程 有 多 个 人 人口， 那么 编译 器 可 以 插入 
一 个 mo 并 加 入 从 no 到 每 一 个 实际 入 口 点 的 边 。 同 样 地 ，ny 对 应 于 这 一 个 过 程 的 出 口 点 。 多 个 出 口 比 多 个 
入 口 更 一 般 ， 但 是 编译 器 很 容易 插入 一 个 ny 并 加 入 连结 每 一 个 真实 出 口 到 这 个 的 边 。 

CFG 给 出 可 能 的 运行 时 控制 流 路 径 的 一 种 图 形 表示 。 图 5-2 给 出 两 个 例子 : 一 个 是 循环 ， 另 一 个 是 
简单 的 条 件 控制 。 这 与 诸如 AST 这 样 的 面向 语法 的 IR 不 同 ， 在 这 样 的 IR 中 边 表示 文法 结构 。 因 此 ， 
wh11e 循 环 的 CFG 包 含 一 个 环 ， 而 它 的 AST 是 无 环 的 。 条 件 控制 的 CFG 如 期 望 的 那样 是 无 环 的 。 它 表示 
控制 总 是 从 stmt, 和 sim 流向 stmt;。 在 AST 中 ， 这 一 关系 是 隐 式 的 ， 而 不 是 显 式 的 。 

编译 器 通常 与 另 一 个 IR 一 起 使 用 CFG。CFG 表 示 块 之 间 关 系 ， 而 使 用 诸如 用 表达 式 级 AST、DAG 或 
线性 三 地 址 码 这 样 的 巨 来 表示 操作 块 内 的 操作 。 这 种 组 合 可 以 认为 是 一 个 混合 型 IR。 

CFG 实 现 中 的 一 个 权衡 问题 是 决定 每 个 块 内 包含 多 少 代码 。 两 个 最 一 一 般 的 粒度 是 单一 语句 块 和 基本 
块 。 有时， 我 们 使 用 单一 语句 块 来 简化 分 析 和 优化 的 算法 。 

使 用 单一 语句 块 生成 的 CFG 比 使 用 基本 块 所 生成 的 CFG 大 。 很 多 优化 和 代码 生成 技术 注释 CFG 中 的 
结 点 和 边 。 因 为 单一 语句 CEG 有 更 多 的 结 点 和 边 ， 它 可 能 需要 更 多 的 注释 空间 和 更 多 的 时 间 ， 并 为 构建 
这 些 注 释 并 把 它们 从 一 个 块 拷贝 到 另外 一 个 块 而 付出 更 多 的 努力 。 

使 用 基本 块 的 CFG 的 结 点 和 边 要 比 单一 语句 的 CFG 的 结 点 和 边 少 。 在 这 一 模型 中 ， 编 译 器 必须 找到 
每 一 个 块 的 开始 和 结束 ， 而 这 对 单一 语句 块 来 说 是 一 个 显然 的 问题 人 。 这 一 模型 减 小 了 保存 注释 所 需要 


日 ”原文 中 为 y， 应 为 x。 一 一 译 者 注 

日 、 一 般 地 ， 基 本 块 开始 于 带 标签 语句 ， 因 为 可 以 沿 着 多 条 路 径 达 到 它们 。 一 个 过 程 中 的 第 一 个 操作 ， 无 论 是 
否 带 有 标签 ， 都 是 一 个 块 的 开始 。 块 结束 于 一 个 分 支 或 跳 转 。 谓 词 操作 也 结束 块 ， 因 为 事实 上 它们 在 代码 
中 创建 两 条 路 径 。 
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的 空间 。 然 而 ， 计 算 和 使 用 注释 的 算法 必须 处 理 更 大 的 块 所 固有 的 聚集 。 可 能 需要 某 种 解释 来 决定 在 一 
个 块 内 的 某 一 个 特殊 点 处 哪些 事实 为 真 。 


while(i < 100) while i < 100 
begin SN 
stmt, stmt, 
end 
stmtz stmt 


While 循环 及 其 CFG 片 段 


if (x = y) if (x = y) 
then stmt, ZN 
else stmt. stmt, stmt 


stmt \ £ 
stmt; 


一 个 简单 的 条 件 控制 及 其 CFG 片 段 





图 5-2 控制 流 图 片段 


编译 器 中 很 多 不 同 的 活动 或 者 显 式 地 或 者 隐 式 地 依赖 于 控制 流 图 。 支 持 优化 的 分 析 一 般 开 始 于 控制 
流 分 析 和 CEFG 的 构建 (参见 第 9 章 )。 指 令 调 度 需要 CFG 来 理解 各 个 块 的 已 调度 代码 是 如 何在 一 起 流动 的 


(参见 第 12 章 )。 全 局 寄存 器 分 配 依赖 于 CFG 来 理解 每 一 个 操作 的 执行 频率 以 及 放置 在 寄存 器 与 内 存 之 间 


移动 值 的 操作 的 位 置 (参见 第 13 章 ) 。 

2. 相关 图 

编译 器 使 用 图 编码 从 一 个 值 的 创建 点 即 定义 点 (definition point) 到 它 的 使 用 点 (use point) 之 间 的 
流向 。 数 据 相 关 图 (date-dependence graph) 直接 编码 这 一 关系 。 

数据 相关 图 中 的 结 点 表示 操作 。 大 多 数 操作 既 使 用 值 又 定义 新 值 。 数 据 相 关 图 中 的 边 连 结 两 个 结 点 ， 
其 中 一 个 结 点 使 用 另外 一 个 结 点 定义 的 结果 。 我 们 使 用 从 定义 到 使 用 的 边 画 出 相关 图 。 

为 了 具体 化 这 一 讨论 ， 图 5-3 再 次 给 出 图 1-3 的 例子 ， 并 给 出 它 的 数据 相关 图 。 这 个 图 对 块 中 每 一 个 
语句 有 一 个 结 点 。 每 一 条 边 表示 一 个 值 的 流向 。 例 如 ， 从 3 到 7 的 边 反 映 出 语句 3 中 的 r, 的 定义 以 及 其 后 
它 在 语句 7 中 的 使 用 。rar 的 使 用 指出 它 在 这 一 过 程 的 开始 处 的 隐 式 定义 ; 我 们 用 粗 边 表示 这 些 使 用 。 


loadAI Tarp, @w > rw 
loadI 2 => rz 
loadAI Tarp, @X > rx 
loadAI Tarp» @y => ry 
loadAI Tarp, @Z > rz 
mult Twos => Ty 
mult Tws => Tw 
mult Tas => Ty 
mult rw， > rw 


storeAI ry => Tarp» 0 





图 5-3 一 个 ILOC 基 本 块 和 它 的 相关 图 


N 
N 
— 


N 
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图 中 的 边 表示 对 这 一 操作 序列 的 实际 限制 ， 也 就 是 说 ， 一 个 值 在 它 定 义 之 前 是 不 能 使 用 的 。 然 而 ， 
这 一 相关 图 没有 充分 描述 这 一 程序 的 控制 流 。 例 如 ， 这 个 图 要 求 1 和 2 领先 于 6。 然 而 ， 并 没有 要 求 1 或 2 
领先 于 3。 很 多 执行 序列 保持 代码 所 示 的 相关 性 ， 包 括 <1，2，3，4，5，6，7，8，9，10> 和 <2，1，6， 
3，7，4，8，5，9，10>。 这 一 偏 序 中 的 自由 度 正 是 “无 序 ” 处 理 器 要 利用 的 。 

在 更 高 层次 上 ， 考 虑 图 5-4 所 示 的 代码 片段 。 相 关 图 表明 ， 对 a[i] 的 引用 从 代表 a 的 先前 定义 的 结 点 
得 到 它们 的 值 。 这 通过 一 个 结 点 把 a 的 所 有 使 用 都 连接 起 来 。 不 对 下 标 表达 式 做 复杂 的 分 析 ， 编 译 器 是 
无 法 区 分 对 各 个 数组 元 素 引 用 的 。 


*x¢+0O 


- iel 

> | while (i < 100) D 
4 if (ali) > 0) 

z 6 


then x + x + a[i] AY 
ieiti 2 


| 





图 5-4 控制 流 和 相关 图 间 的 相互 作用 


这 一 相关 图 比 前 面 的 例子 更 复杂 。 结 点 5 和 结 点 6 都 依赖 于 它们 自己 ; 它们 使 用 它们 在 前 面 的 迭代 中 
定义 的 值 。 例 如 ， 结 点 6 既 可 能 从 结 点 2 (在 初始 迭代 中 ) 也 可 能 从 它 自己 (在 后 面 的 迭代 中 ) 获取 i 的 
值 。 结 点 4 和 结 点 5 获取 的 i 的 值 也 有 两 个 不 同 的 来 源 : 结 点 2 和 结 点 6。 

数据 相关 图 经 常用 来 派生 IR， 为 了 某 个 特殊 任务 从 明确 的 IR 构 造 出 来 ， 并 在 使 用 后 丢弃 。 这 些 数据 
相关 图 在 指令 调度 中 起 着 重要 的 作用 (参见 第 12 章 )。 它 们 被 运用 于 各 种 优化 ， 特 别 是 通过 对 循环 重新 
排序 来 揭示 并 行 性 的 转换 ， 以 及 改进 内 存 行 为 的 优化 中 ; 这 些 应 用 通常 都 需要 对 数组 下 标 做 更 复杂 的 分 
析 ， 以 便 更 精确 地 决定 数组 的 存 取 模式 。 在 数据 相关 图 的 更 复杂 的 应 用 中 ， 编 译 器 可 能 对 数组 下 标 值 执 
行 大 量 的 分 析 来 决定 何 时 对 同一 数组 的 引用 可 能 重合 。 


5.4 线性 IR 


图 示 IR 之 外 的 另 一 个 形式 是 线性 IR。 一 个 汇编 语言 程序 是 线性 代码 的 一 种 形式 。 它 是 由 按照 代码 出 
现 的 顺序 (或 与 这 一 顺序 一 致 的 顺序 ) 执行 的 一 系列 指令 组 成 的 。 指 令 可 能 包含 多 个 操作 ; 假如 是 这 样 
的 话 ， 那 么 这 些 操作 并 行 执 行 。 用 于 编译 器 的 线性 IR 与 某 个 抽象 机 器 的 汇编 代码 相似 。 

使 用 线性 形式 背后 的 理论 很 简单 。 充 当 编译 器 输入 的 源 代码 是 线性 的 ， 同 样 编译 器 所 释放 的 目标 机 
器 代码 也 是 线性 的 。 若 干 早 期 编译 器 使 用 线性 IR; 对 这 些 编译 器 的 设计 者 来 说 这 是 很 自然 的 表 记 法 ， 因 
为 他 们 在 此 之 前 是 用 汇编 代码 编程 的 。 

线性 IR 为 操作 序列 引入 一 个 清晰 而 实用 的 顺序 。 例 如 ， 在 图 5-3 中 的 代码 与 ILOC 代 码 和 数据 相关 图 
形成 鲜明 的 对 比 。ILOC 代 码 具 有 隐 式 的 顺序 ; 相关 图 引入 一 个 允许 许多 不 同 执行 顺序 的 偏 序 。 

如 果 线 性 耻 用 作 编 译 器 中 的 明确 的 表示 ， 那 么 它 必 须 包 含 描绘 程序 中 各 点 之 间 的 控制 转移 的 机 制 。 
线性 IR 中 的 控制 流通 常 模型 化 目标 机 器 上 的 控制 流 的 实现 。 因 此 ， 线 性 代码 通常 包含 条 件 分 支 和 跳 转 。 
控制 流 划分 出 线性 人 R 中 的 基本 块 ; 块 结束 于 分 支 、 跳 转 或 带 标 签 操作 的 前 一 条 指令 。 

在 本 书 使 用 的 ILOC 中 ， 我 们 在 每 一 个 块 的 结束 处 包含 一 个 分 支 或 跳 转 。 在 ILOC 中 ， 分 支 操作 为 采 
用 路 径 和 拒绝 路 径 指定 标签 。 这 消除 在 一 个 块 的 结束 处 的 任意 穿 过 路 径 。 同 时 ， 这 些 约束 使 得 寻找 基本 
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块 并 重 排 序 它 们 变 得 容易 。 

编译 器 中 使 用 多 种 线性 IR。 有 一 些 线性 IR 已 不 再 使 用 ， 因 为 它们 所 模型 化 的 体系 结构 已 不 再 使 用 。 
单 地 址 码 模型 化 累加 器 机 器 的 行为 。 这 些 代码 向 编译 器 揭示 出 计算 机 的 有 限 名字 空 间 ， 使 得 编译 器 为 适 
应 这 些 限 制 进行 代码 裁剪 。 同 样 地 ， 二 地 址 代码 模型 化 带 有 破坏 性 操作 的 机 器 ， 在 这 些 操作 中 一 个 变量 
既 充 当 操作 数 又 充当 这 一 操作 结果 的 目标 。 二 地 址 代码 为 编译 器 给 出 明确 选择 破坏 性 操作 数 的 IR。 在 计 
算 机 走出 这 些 指 令 格式 的 同时 ， 编 译 器 从 相应 的 切 走 了 出 来 。 

本 节 描 述 用 于 现代 编译 器 中 的 两 个 线性 IR: 栈 机 器 代码 和 三 地 址 代码 。 栈 机 器 代码 给 出 一 个 紧凑 、 
高 效 存储 的 表示 。 在 诸如 在 执行 前 需要 在 网 络 传输 的 Jave 小 程序 这 样 IR 的 大 小 是 重要 因 系 的 应 用 中 ， 栈 
机 器 代码 有 意义 。 三 地 址 代码 模型 化 现代 RISC 机 器 的 指令 格式 ， 它 对 两 个 操作 数 和 一 个 结果 有 不 同 的 名 
字 。 你 已 经 对 一 种 三 地 址 代码 非常 熟悉 了 ， 即 本 书 中 所 使 用 的 ILOC。 


5.4.1 栈 机 器 代码 


栈 机 器 代码 有 时 称 为 单 地 址 代码 ， 它 假设 操作 数 栈 的 存在 。 大 多 数 操作 从 栈 中 取 它 们 的 操作 数 并 把 
它们 的 结果 压 人 到 樟 中 。 例 如 ， 整 数 的 减 运算 将 把 栈 顶 的 两 个 元 素 移出 栈 ， 并 把 这 两 个 元 素 的 差 压 人 到 
栈 中 。 栈 的 规则 产生 对 某 些 新 操作 的 需要 。 栈 IR 通 常 包 括 交换 栈 顶 两 个 元 素 的 swap 操 作 。 人 们 已 经 构建 
了 若干 种 基于 栈 的 计算 机 ; 这 一 下 似乎 是 应 这 些 机 器 的 编译 要 求 而 生 的 。 图 5-5 左 边 一 栏 给 出 表达 式 x-2 
xy 的 单 地 址 代码 。 


push 2 tl + 2 
push y tz = y 
multiply t3 e ti x te 


push x tex 
subtract ts e ty — ts 


栈 机 器 代码 三 地 址 代码 





图 5-5 x-2 x y 的 线性 表示 


栈 机 器 代码 很 具 紧 凑 。 栈 创建 一 个 隐 式 名 字 空 间 并 从 巩 中 消去 很 多 名 字 。 这 缩小 阴 形 式 的 程序 大 小 。 
然而 ， 使 用 栈 意 味 着 所 有 的 结果 和 参数 都 是 暂时 的 ， 除 非 代码 明确 地 把 它们 移 到 内 存 中 去 。 


栈 机 器 代码 容易 生成 及 执行 。 诸 如 Smalltalk 80 和 Java 等 语言 使 用 字 节 码 ， 而 字 节 码 是 描绘 程序 的 抽 


象 栈 机 器 代码 。 字 节 码 或 者 在 为 目标 机 器 实现 的 解释 器 上 运行 ,或 者 在 执行 之 前 被 翻译 成 目标 机 器 代码 。 
这 生成 一 种 系统 ， 这 一 系统 为 程序 发 布 提供 紧凑 程序 ， 而 且 为 把 代码 移植 到 新 的 目标 机 器 (解释 器 的 实 
现 ) 提供 简单 的 解决 方案 。 


5.4.2 三 地 址 代码 


在 三 地 址 代码 中 ， 大 多 数 操作 具有 形式 x<-y op z， 它 带 有 一 个 操作 符 〈op )、 两 个 操作 数 (y 和 z ) 
和 一 个 结果 (xX)。 诸 如 立即 装 入 和 跳 转 等 操作 将 需要 较 少 的 参数 。 有 时候 ， 需 要 带 有 超过 三 个 地 址 的 操 
作 。 图 5-5 最 右 栏 给 出 表达 式 x-2 x y 的 三 地 址 代码 。 

三 地 址 代码 因 以 下 几 个 原因 而 具有 吸引 力 。 第 一 ， 不 存在 破坏 性 的 操作 符 使 得 编译 器 自由 地 复 用 名 
字 和 值 。 程 序 到 三 地 址 代码 的 翻译 引入 一 组 新 的 由 编译 器 生成 的 名 字 ， 这 些 名 字 保 存 各 操作 的 结果 。 细 
心 筛选 名 字 空 间 可 以 揭示 出 改进 代码 的 新 因素 。 第 二 ， 三 地 址 代码 相当 紧凑 。 大 多 数 操作 都 是 由 四 项 组 
成 : 一 个 操作 符 和 三 个 名 字 。 操 作 符 和 名 字 都 来 自 于 有 限 集合 。 一 般 地 ， 操 作 符 需要 1 或 2 个 字 节 。 而 名 
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字 通 常 由 整数 或 表 索 引 来 表示 ; 无 论 哪 种 情况 ，4 个 字 节 通常 就 足够 了 。 最 后 ， 因 为 很 多 现代 处 理 器 实 
现 三 地 址 操作 ， 三 地 址 代码 可 以 很 好 地 模型 化 它们 的 性 质 。 

不 同 的 三 地 址 代码 表示 的 特殊 操作 符 的 集合 以 及 抽象 级 别 有 很 大 不 同 。 通 常 ， 三 地 址 IR 将 包含 大 部 
分 低级 操作 ， 诸 如 跳 转 、 分 支 和 简单 的 内 存 操作 等 ， 此 外 还 有 较 复杂 的 操作 ， 如 mvc1、max 或 min 等 。 表 
示 这 些 复杂 操作 将 使 这 些 操 作 容 易 分 析 和 优化 。 

例如 ，mvc1(move charactera long) 取 一 个 源 地 址 ， 一 个 目标 地 址 和 一 个 字符 记 数 。 它 把 内 存 中 源 地 
址 开始 的 特定 数目 的 字符 拷贝 到 目标 地 址 开始 的 内 存 中 。 有 些 机 器 ， 例 如 像 IBM 370， 仅 用 一 个 指令 
(mvc1 是 IBM 370 的 一 个 操作 码 ) 就 可 实现 这 一 功能 。 在 一 台 在 硬件 上 没有 实现 这 一 操作 的 机 器 上 ， 也 
许 需要 更 多 操作 来 执行 这 样 的 拷贝 。 

把 mvc1 加 入 三 地 址 代码 使 得 编译 器 紧凑 地 表示 这 一 复杂 的 操作 。 它 允许 编译 器 在 不 考虑 其 内 部 工作 
的 情况 下 分 析 、 优 化 及 移动 这 一 操作 。 如 果 硬 件 支持 与 mvc1 类 似 的 操作 ， 那 么 代码 生成 将 把 这 个 食 结 构 
直接 映射 到 该 硬件 操作 上 。 如 果 硬 件 不 支持 与 mvc1 类 似 操作 ， 那 么 编译 器 可 以 在 最 后 的 优化 和 代码 生成 
之 前 先 把 mvc1 翻 译 成 一 系列 低级 及 操作 。 


5.4.3 表示 线性 代码 


我 们 已 使 用 多 种 数据 结构 来 实现 线性 人民 。 编 译 器 设计 者 所 做 的 这 一 选择 会 对 琉 代 码 上 的 各 种 操作 的 
代价 产生 影响 。 因 为 编译 器 花费 大 部 分 时 间 处 理 代码 的 IR 形 式 ， 这 些 代 价值 得 我 们 注意 。 尽 管 我 们 的 讨 
论 集中 于 三 地 址 码 ， 但 是 其 中 很 多 地 方 同样 适 用 于 栈 机 器 代码 (或 任意 其 他 线性 形式 )。 

三 地 址 代码 通常 被 当 作 四 元 组 来 实现 。 每 一 个 四 元 组 由 四 个 域 表示 : 一 个 操作 符 ， 两 个 操作 数 (或 
源 ) 和 一 个 目标 。 为 了 形成 块 ， 编 译 器 需要 将 各 个 四 元 组 联系 起 来 的 机 制 。 编 译 器 以 不 同 的 方式 实现 四 


| 实际 使 用 中 的 IR 


| 在 实践 中 ， 编 译 器 使 用 各 种 IR。 为 了 优化 ，IBM 的 FORTRANH 编 译 器 使 用 四 元 组 和 控制 流 图 来 | 
| 表示 代码 。 因 为 这 一 编译 器 是 用 FORTRAN 写 成 的 ， 所 以 存放 三 地 址 代码 的 数据 结构 是 一 个 数组 。 
便携 式 C 编 译 器 PCC 的 分 析 器 为 控制 结构 释放 汇编 代码 并 为 表达 式 构 建 低级 树 。 它 为 表达 式 树 | 
细心 地 生成 代码 ， 这 基于 大 部 分 时 间 都 花费 在 表达 式 评 估 上 的 假设 。 | 
| GCC 长 期 以 来 依赖 于 一 个 非常 低级 的 称 为 寄存 器 转移 语言 (RIL) 的 IR。RTL 非 常 适合 于 地 址 
计算 和 标量 算术 操作 的 详细 优化 。 它 隐藏 诸如 数组 引用 等 高 级 内 存 优化 所 需 的 一 些 抽象 。 为 了 处 理 | 


| 这 些 问 题 ，GCC 的 G++ 前 端 在 为 更 一 般 的 优化 和 代码 生成 生成 RTL 形 式 之 前 ， 为 C++ 的 某 些 特殊 优 | 
化 使 用 AST。 | 
IBM PL.8 编 译 器 使 用 比 IBM 801 处 理 器 中 的 指令 集合 抽象 级 稍 低 的 低级 线性 侠 。 这 揭示 出 后 来 A 

可 以 登入 到 地 址 模式 计算 的 一 些 计算 。 这 一 编译 器 有 若干 前 端 和 后 端 ; 它们 都 使 用 相同 的 IR。HP 


PA-RISC 编 译 器 有 类 似 的 结构 。 

Open64 编 译 器 ， 这 是 IA-64 体 系 结构 的 一 个 开源 编译 器 ， 使 用 称 为 WHIRL 的 五 个 相关 IR。 分 析 
器 中 的 最 初 转换 生成 贴近 源 代码 级 的 WHIRL。 后 继 阶段 把 更 多 细节 引入 到 WHIRL 程 序 中 ， 从 而 降 | 
低 抽 象 等 级 靠近 实际 机 器 代码 。 这 使 得 编译 器 对 源 代码 文本 为 基于 相关 性 的 转换 使 用 源 代码 级 AST， 
并 且 为 优化 和 代码 生成 的 后 期 阶段 使 用 低级 的 式 ， 





图 5-6 给 出 三 个 实现 图 5-5 的 三 地 址 代码 的 不 同方 案 。 此 图 左边 所 示 的 最 简单 的 方案 使 用 一 个 短 数组 
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来 表示 每 一 个 基本 块 。 编 译 器 设计 者 通常 把 数组 放置 在 CFG 的 一 个 结 点 中 。( 这 也 许 是 混合 IR 的 最 一 般 
形式 . ) 图 中 中 央 所 示 的 方案 使 用 一 个 指针 数组 把 四 元 组 组 织 成 一 个 块 ; 这 一 指针 数组 可 以 包含 在 一 个 
CFG 结 点 中 。 图 中 右边 所 示 的 最 后 方案 把 四 元 组 链接 起 来 形成 一 个 列表 。 这 一 方案 在 CFG 的 结 点 中 需要 
的 存储 最 少 ， 它 的 代价 是 我 们 只 能 做 顺序 沉 历 。 


[村 一 tc 

[二 tc 

E 

eiel- | 

lts- felts 
指针 数组 

图 5-6 三 地 址 代码 的 实现 227 


考虑 在 这 一 块 中 重新 安排 代码 所 产生 的 代价 。 第 一 个 操作 把 一 个 常量 装 和 人 到 一 个 寄存 器 中 ; 在 大 多 
数 机 器 上 ， 这 直接 翻译 成 一 个 立即 装 入 操作 。 第 二 个 和 第 四 个 操作 从 内 存 装 和 人 值 ， 在 大 多 数 机 器 上 ， 这 
一 操作 将 带 来 多 周期 的 等 待 ， 除 非 这 些 值 已 在 主 缓冲 器 中 。 为 了 隐藏 一 些 这 样 的 等 待 ， 指 令 调 度 器 可 能 
将 y 和 x 的 装 入 移 到 在 2 的 立即 装 入 之 前 。 

在 简单 数组 方案 中 ， 把 y 的 装 入 移 到 立即 装 入 之 前 要 求 保存 第 一 个 操作 的 四 个 域 ， 并 把 相应 的 域 从 
第 二 个 位 置 拷贝 到 第 一 个 位 置 ， 然 后 用 被 保存 的 立即 装 入 的 值 重 写 第 二 个 位 置 的 这 些 域 。 指 针 数 组 方案 
也 要 求 同 样 的 三 步 方法 ， 只 是 只 须 改 变 指 针 的 值 。 因 此 ， 编 译 器 保存 指向 立即 装 入 的 指针 ， 把 指向 y 的 
装 入 的 指针 拷贝 到 这 一 数组 中 的 第 一 个 位 置 ， 并 用 已 保存 的 指向 立即 装 入 的 指针 重 写 在 这 一 数组 的 第 二 
个 位 置 。 对 于 链表 方案 操作 是 类 似 的 ， 不 同 的 只 是 需要 存储 足够 的 指针 来 遍历 链表 。 

现在 ,考虑 当前 端 生成 首 轮 耻 时 发 生 什么 事情 。 使 用 简单 数组 形式 和 指针 数组 ， 编 译 器 必须 选 定 这 
个 数组 的 大 小 ， 事 实 上 ， 也 就 是 编译 器 预期 一 个 块 中 所 含 的 四 元 组 的 数量 。 当 它 生 成 四 元 组 时 ， 它 填充 
这 一 数组 。 如 果 数 组 过 大 ， 那 么 数组 会 浪费 空间 。 如 果 数 组 过 小 ， 那 么 为 了 得 到 更 大 的 数组 ， 编 译 器 必 
须 重新 分 配 数 组 并 把 过 小 的 数组 的 内 容 找 贝 到 这 一 新 的 大 数组 中 。 然 而 ， 链 表 避 免 这 些 问 题 。 扩 展 链表 
只 需要 分 配 新 四 元 数组 并 设置 链表 的 适当 指针 。 

在 多 遍 编 译 器 中 ， 使 用 不 同 实现 来 表示 编译 过 程 中 不 同 点 处 的 IR 是 有 意义 的 。 在 前 端 ， 也 就 是 致力 
于 生成 IR 的 地 方 ， 链 表 也 许 既 可 简化 实现 又 可 减 小 整体 代价 。 在 指令 调度 器 中 ， 由 于 它 致力 于 重新 安排 
操作 ， 所 以 使 用 数组 的 两 种 实现 可 能 更 有 意义 。 

注意 ， 某 种 信息 从 图 5-6 中 消失 了 。 例 如 ， 图 5-6 没 有 给 出 标签 ， 因 为 标签 是 块 的 性 质 而 不 是 任意 单 
个 四 元 组 的 性 质 。 在 块 中 存储 标签 列表 比 在 每 个 四 元 组 中 存储 标签 节省 空间 ; 它 还 突出 标签 只 出 现在 基 
本 块 的 第 一 个 操作 上 的 性 质 。 让 标签 依附 于 块 ， 当 重新 排列 块 内 的 操作 时 ， 编 译 器 可 以 忽视 这 些 标 签 ， 
从 而 稍微 简化 操作 。 22 


5.5 静态 单 赋值 形式 


一 个 程序 的 静态 单 赋值 形式 (static single-assignment form, SSA) 把 有 关 控制 流 和 数据 流 的 信息 加 
入 到 这 一 程序 的 文本 中 。SSA 形 式 描绘 代码 的 名 字 空 间 中 的 定义 和 使 用 的 信息 。 每 一 个 名 字 由 代码 中 的 
一 个 操作 定义 ， 因 此 也 就 有 了 静态 单 赋 值 的 命名 。 为 了 使 单 赋值 规则 与 控制 流 的 影响 一 致 ，SSA 形 式 在 
控制 流 路 径 相 遇 的 地 点 插入 被 称 之 为 办 函数 的 特殊 操作 。 
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当 程 序 满足 两 个 约束 时 它 是 SSA 形 式 : (1) 每 个 定义 有 各 自 不 同 的 名 字 ; (2) 每 次 使 用 只 涉及 一 
个 定义 。 为 了 把 IR 程 序 转换 成 SSA 形 式 ， 编 译 器 在 不 同 的 控制 流 路 径 合并 的 地 点 插入 办 函数 ， 而 且 它 重 
新 命名 变量 使 得 单一 赋值 性 质 成 立 。 

为 了 遍 明 这 些 规则 的 影响 ， 考 虑 如 图 5-7 的 左边 所 示 的 小 循环 。 右 栏 给 出 SSA 形 式 的 相同 代码 。 变 量 
名 包括 为 每 个 定义 创建 不 同名 字 的 下 标 。 包 函数 被 插入 到 多 个 不 同 值 能 够 达到 块 的 开头 的 地 点 。 最 后 ， 
SSA 形 式 使 用 两 个 不 同 的 测试 重 写 whi1e 结 构 来 反映 最 初 的 测试 引用 xo 而 循环 结束 测试 引用 x: 这 一 事实 。 


Xo 人 …- 


Yo 4 
if (xo > 100) goto next 
loop: xı + (Xo,X2) 
Yı = O(Yos¥2) 
Xo + xX) + 1 


Xe eee 
4 
while(x < 100) 
xext+] 


yoyrtx yz — Yi + X2 


if (xz < 100) goto loop 
next:x3 + 6(x9,X2) 
¥3 + $(Yo.¥2) 


SSA 形 式 





图 5-7 SSA 形 式 中 的 小 循环 


办 函数 的 行为 方式 与 众 不 同 。 它 使 用 对 应 于 控制 进入 块 的 边 的 参数 的 值 定义 它 的 目标 SSA 名 字 。 因 
此 ， 当 控制 流 从 上 方 进入 循环 时 ， 循 环 体 顶 端的 少 函 数 把 xs 和 yo 的 值 分 别 复制 到 x; 和 yi 中 。 当 控制 流 从 循 
环 的 底部 测试 进入 循环 时 ， 和 函数 选择 它们 的 另 一 个 参数 Xz 和 y,。 

在 基本 块 的 入 口 处 ， 所 有 的 类 函数 在 执行 其 他 语句 之 前 同时 执行 。 因 此 ， 这 些 $ 函 数 都 读 取 适当 参 
数 的 值 ， 然 后 它们 都 定义 它们 的 目标 SSA 名 。 使 用 这 种 方式 定义 和 函数 的 行为 使 得 处 理 SSA 形 式 的 算法 
忽视 块 顶端 的 函数 的 师 序 ， 这 是 一 个 重要 的 简化 。 正 如 我 们 将 在 9.3.4 节 中 所 看 到 的 那样 ， 它 会 使 SSA 
形式 翻译 回 可 执行 代码 的 过 程 复杂 化 。 

我 们 为 代码 优化 而 设计 了 SSA 形 式 。SSA 形 式 中 办 函数 的 设置 为 编译 器 提供 有 关 值 的 流向 的 信息 ; 
编译 器 可 以 使 用 这 一 信息 来 改进 它 所 生成 的 代码 的 质量 。 这 一 名 字 空 间 消除 任意 与 值 的 生存 期 相关 的 问 
题 。 因 为 每 一 个 值 刚好 在 一 个 指令 中 定义 ， 它 在 从 这 一 指令 开始 的 任何 路 径 上 都 可 用 。 这 两 个 性 质 简 化 
并 改进 很 多 优化 技术 。 

这 一 例子 暴露 一 些 值得 解释 的 SSA 形 式 的 奇怪 之 处 。 考 虑 定义 x 的 函数。 这 一 函数 的 第 一 个 参数 
xu 是 在 领先 于 循环 的 块 中 定义 的 。 它 的 第 二 个 参数 x: 是 后 来 在 包含 这 一 人 函数 的 块 中 定义 的 。 因 此 ， 当 
这 一 禾 函 数 第 一 次 执行 时 ， 它 的 一 个 参数 还 没有 定义 。 在 很 多 程序 设计 语言 的 上 下 文中 ， 这 会 引发 问题 。 
因为 作 函 数 只 读 取 一 个 参数 ， 而 且 这 个 参数 对 应 于 最 近 在 CFG 中 所 取 的 边 ， 所 以 它 可 以 从 不 读 取 没有 定 
义 的 参数 。 


| 构建 SSA 


| 静态 单 赋值 形式 是 我 们 描述 的 极 中 惟一 没有 显然 构造 算法 的 IR 。9.3 节 给 出 算法 的 详情 。 然 而 ，| 
| 构造 过 程 的 略图 可 以 阐明 一 些 问题 。 假 设 输入 程序 是 ILOC 形 式 。 为 了 将 其 转换 成 等 价 的 线性 SSA 形 | 


| 式 ， 编 译 器 必须 首先 插入 从 孙 数 ， 然 后 重新 命名 每 一 个 ILOC 虚 拟 寄 存 器 。 | 
” 播 入 办 函数 的 最 简单 方法 是 在 控制 流 图 中 有 多 于 一 个 前 驱 的 每 个 基本 块 的 开始 处 ， 为 每 个 二 DC | 
虚拟 寄存 器 加 入 一 个 办 函数 。 这 会 插入 许 多 无 用 的 四 函数 ; 完整 算法 中 最 复杂 的 部 分 就 是 减少 多 余 | 
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信函 数 的 数目 。 

为 了 重新 命名 ILOC 虚 拟 寄存 器 ， 编 译 器 可 以 按 深度 优先 的 方式 处 理 块 。 它 为 每 个 虚拟 寄存 器 维 
护 一 个 计数 器 。 当 编译 器 遇 到 m~ 的 一 个 定义 时 ， 编 译 器 递增 的 计数 器 ， 如 果 递 增 后 的 计数 器 值 为 k， 
那么 它 用 名 字 ri 重 写 该 定义 。 在 编译 器 遍历 块 的 过 程 中 ， 它 按 r1 的 计数 器 的 当时 值 重 写 r1 的 每 一 个 


使 用 。 也 就 是 说 ， 它 用 ri, 重 写 r+， 直 到 遇 到 另 一 个 "的 定义 。( 该 定义 使 这 一 计数 器 跳 到 K+1。) 在 块 
的 末尾 ， 编 译 器 查看 控制 流 的 每 个 边 ， 并 在 每 个 有 多 个 前 驱 的 块 中 为 ri 重 写 适 当 少 函数 的 形 参 。 

在 重新 命名 之 后 ， 代 码 符 合 SSA 形 式 的 两 条 规则 。 每 个 定义 生成 惟一 一 个 名 字 。 每 个 使 用 只 涉 
及 一 个 定义 。 存在 者 二 更 好 的 SSA 构 造 算法 ， 它 们 比 这 一 RETARA EDER. 


为 了 在 三 地 址 IR 中 使 用 SSA 形 式 ， 编 译 器 设计 者 必须 包含 一 个 表示 任意 大 的 操作 的 机 制 。 考 虑 选择 
语句 结尾 处 的 块 。 


Switch on yo 


XI 《一 … X2 EC X15 X16 


~> 
X17 《一 中 人 
xz 的 罗 函 数 必 须 对 每 一 种 情况 有 一 个 参数 。 少 操作 对 每 一 个 进入 控制 流 的 路 径 有 一 个 参数 ; 因此 ， 
它 不 适合 固定 参数 数目 、 三 地 址 方案 。 
在 三 地 址 代码 的 简单 数组 表示 中 ， 编 译 器 设计 者 必须 或 者 为 这 个 办 操作 使 用 多 个 位 置 或 者 使 用 其 他 
数据 结构 存放 少 操 作 的 参数 。 图 5-6 中 所 给 出 的 另外 两 个 方案 中 ， 编 译 器 可 以 插入 可 变 大 小 的 三 元 组 。 例 
如 ， 装 入 和 装 入 立即 的 三 元 组 也 许 有 恰好 两 个 名 字 的 空间 ， 而 办 操 作 的 三 元 组 也 许多 许 任意 数目 的 名 字 。 


5.6 把 值 映射 到 名 字 


特定 IR 和 抽象 等 级 的 选择 有 助 于 确定 编译 器 能 够 处 理 和 优化 的 操作 。 例 如 ， 源 代码 级 AST 使 得 很 容 
易 找 到 对 一 个 数组 x 的 所 有 引用 。 同 时 ， 它 把 存 取 x 的 元 素 所 需 的 地 址 计算 的 细节 隐藏 起 来 。 相 反 ， 诸 如 
ILOC 这 样 的 低级 线性 IR 揭 示 出 地 址 计算 的 细节 ， 其 代价 是 隐藏 了 与 x 相关 的 特定 引用 。 这 些 影响 是 众 所 
周知 的 。 l 

对 在 执行 期 间 计算 的 值 指定 内 部 名 字 的 规则 的 选择 也 有 类 似 的 效应 。 对 名 字 的 生成 、 处 理 和 使 用 方 


式 的 仔细 关注 可 以 揭示 对 优化 有 价值 的 因素 。 而 忽视 这 一 问题 将 导致 这 些 因 素 含 混 不 清 。 为 了 具体 化 这 


一 讨论 ， 考 虑 图 $-8a 所 示 的 短 块 。 

表达 式 的 每 一 个 操作 数 都 是 一 个 值 ， 表 达 式 的 评估 结果 也 是 一 个 值 。 图 5-8a 中 的 块 具有 名 字 空 间 {a， 
b,c，d}。 这 一 名 字 的 选择 把 多 个 值 映 射 到 一 个 名 字 上 。 在 这 个 块 的 开始 处 ， 我 们 可 以 假设 >、c 和 d 中 
的 每 一 个 都 已 被 定义 。b 在 第 一 个 语句 中 的 使 用 与 b 在 第 三 个 语句 中 的 使 用 涉及 不 同 的 值 ， 除 非 c=d。 名 
字 b 在 第 二 和 第 三 个 语句 中 的 复 用 没有 向 编译 器 传达 什么 信息 ; 事实 上 ， 它 可 能 误导 粗心 的 读者 认为 这 
一 代码 把 a 和 c 的 值 设 为 同一 值 。 

然而 ， 查 看 第 二 和 第 四 个 语句 ， 这 个 块 显然 把 > 和 di 设置 为 同一 值 。 与 第 一 和 第 三 个 语 名 一样， 赋值 
右 侧 的 表达 式 从 文本 上 是 相同 的 。 在 第 二 和 第 四 个 语句 中 ， 它 们 使 用 相同 的 值 。 而 在 第 一 和 第 三 个 语句 
中 ， 它 们 使 用 不 同 的 值 。 

POIRIER ES LR RES on. 这 一 AE HCA PAART SIRE RNE HERM. 
我 们 的 四 语句 例子 可 以 按 多 种 方法 翻译 。 图 5-8b 和 图 5-8c 给 出 其 中 两 个 方法 。 图 5-8b 使 用 按 源 代码 中 的 





N 


N 
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那些 名 字 来 使 用 名 字 ， 而 图 5-8c 则 为 计算 中 的 每 个 值 指定 新 名 字 。 

编译 器 生成 名 字 的 方法 可 以 决定 它 能 为 优化 找到 什么 样 的 因素 。 图 5-8b 使 用 较 少 的 寄存 器 。 它 保持 
哪些 计算 必须 生成 相同 结果 的 混淆 。 图 5-8c 使 用 更 多 的 寄存 器 ， 但 是 它 具 有 文本 相同 的 表达 式 生 成 相同 
结果 的 性 质 。 使 用 这 一 命名 规则 ， 这 一 代码 显然 使 得 a 和 c 得 到 不 同 值 ， 而 b 和 d 得 到 相同 值 。 


t3 - ta 


ts 
ts + tz 
ts 
t3 - ta 
ts 


b) 使 用 源 命 名 c) 使 用 值 命名 





图 5-8 命名 导致 不 同 的 翻译 


5.6.1 命名 临时 值 


在 把 源 代码 翻译 成 信 的 过 程 中 ， 编 译 器 必须 为 计算 中 的 很 多 中 间 结 果 创 造 名 字 。 名 字 空 间 的 选择 
令 人 惊讶 地 强烈 影响 着 编译 器 的 行为 。 把 名 字 映 射 到 值 的 策略 很 大 程序 上 决定 哪个 计算 可 以 被 分 析 和 
优化 。 
再 次 考 虚 我 们 前 面 的 数组 A[i，j] 引 用 的 例子 。 这 两 个 IR 片 段 在 完全 不 同 的 抽象 级 别 上 表示 同一 个 






计算 。 

load 1 > ml 
sub rj, n > rz 
JoadI 10 = 73 
mult re, r3 > ra 

sub ry, r > nr5 
‘add ‘ra, rs => Te 
loadI @A => 17 
add r7, re > ra 
load rg = 『4ij 

源 代码 级 树 ILOC 代 码 


低级 忒 向 编译 器 提供 更 多 细节 。 这 些 细节 可 以 从 AST 推 断 而 得 ， 而 且 可 以 生成 代码 。 在 一 个 从 AST 
的 直接 翻译 中 ， 每 一 次 对 A[i，j] 的 引用 都 将 产生 独立 于 上 下 文 的 相同 可 执行 代码 。 

在 低级 代 中， 每 一 个 中 间 结 果 有 它 自 己 的 名 字 。 使 用 不 同 的 名 字 为 分 析 和 转换 提供 它们 的 结果 。 在 
实践 中 ， 编 译 器 在 优化 中 所 能 取得 的 大 多 数 改 进 都 来 自 于 对 上 下 文 的 利用 。 为 了 使 这 一 改进 成 为 可 能 ， 
IR 必 须 揭 示 上 下 文 。 当 命名 对 许多 不 同 值 复 用 一 个 名 字 时 ， 它 可 以 隐藏 上 下 文 。 如 果 它 创造 名 字 与 值 之 
_ 间 的 一 个 对 应 时 ， 它 也 可 以 揭示 上 下 文 。 这 一 问题 不 是 线性 代码 的 特殊 性 质 ; 编译 器 可 以 使 用 揭示 完整 
地 址 计算 的 低级 AST。 
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命名 是 SSA 形 式 的 一 个 关键 部 分 。SSA 形 式 使 用 严格 的 规则 为 代码 所 计算 的 每 一 个 值 生成 一 个 名 字 ， 
无 论 它 是 程序 变量 还 是 临时 的 中 间 值 。 这 一 统一 的 处 理 为 分 析 和 改进 的 研究 提供 很 多 细节 。 它 描绘 有 关 [233] 
每 个 值 的 生成 地 点 的 信息 。 它 为 这 个 值 提供 一 个 “永久 ”的 名 字 ， 即 使 相应 的 程序 变量 被 再 定义 。 使 用 
SSA 名 字 空 间 可 以 改善 分 析 和 优化 的 结果 。 


20 世 纪 80 年 代 末 ， 我 们 为 FORTRAN 语 言 构建 了 一 个 优化 编译 器 。 我 们 为 前 端 尝试 了 若干 种 不 
同 的 命名 方案 。 第 一 个 版 本 通过 增加 下 一 寄存 器 计数 器 为 每 个 计算 生成 一 个 新 的 临时 寄存 器 。 这 生 | 
成 巨大 的 名 字 空 间 ， 例 如 Forsythe、Malcolm 和 Moler 的 奇异 值 分 解 (singular value decomposition, | 
SVD) 的 实现 有 985 个 名 字 ， 它 的 FORTRAN 程 序 有 210 行 代码 。 相 对 于 程序 的 大 小 ， 这 一 名 字 空 间 
似乎 太 大 了 。 它 引发 了 寄存 分 配器 的 速度 和 空间 问题 ， 在 寄存 器 分 配器 中 ， 名 字 空 间 的 大 小 控制 着 


| 很 多 数据 结构 的 大 小 。( 今 天 ， 我 们 已 有 更 好 的 数据 结构 及 带 有 更 多 内 存 的 更 快 的 机 器 。) 
第 二 版 本 使 用 了 一 个 简单 分 配 /释放 协议 来 保存 名 字 。 前 端 根据 需要 分 配 临时 变量 ， 并 当 使 用 完 
成 时 立即 释放 它们 。 这 产生 较 小 的 名 字 空 间 ; 例如 SVD 大 约 使 用 60 个 名 字 。 这 加 速 了 分 配 。 例 如 ， 
在 使 用 SVD 解 决 一 个 关键 数据 流 问 题 寻 找 活 变量 时 ， 它 减 小 60% 的 时 间 。 
遗憾 的 是 ， 用 一 个 临时 名 字 与 多 个 表达 式 相 关联 使 数据 流 不 清晰 并 降低 了 优化 的 质量 。 代 码 质 
| 量 的 下 降 超过 了 所 有 编译 时 间 的 效益 。 


进一步 的 实践 导致 了 一 组 规则 ， 它 在 产生 强大 的 优化 的 同时 还 能 减 小 名 字 空 间 的 增长 。 

1) 每 个 文本 表达 式 得 到 惟一 一 个 名 字 ， 该 名 字 通 过 将 操作 符 和 操作 数 登 录 到 一 个 散 列表 来 决 

。 这 保证 一 个 表达 式 ， 例 如 rir+raz， 的 每 一 次 出 现 都 以 同一 个 寄存 器 为 目标 。 

2) 在 代码 人 op>r，ri 一 r* 中 ， 选 择 k 使 得 1，j<k 成 立 。 

3) 对 于 寄存 器 拷贝 操作 (在 ILOC 中 为 121 m 一 ri)， 当 j 对 应 于 一 个 标量 程序 变量 时 ， 我 们 侈 许 | 
1> j。 对 应 于 这 样 一 个 变量 的 虚拟 寄存 器 只 通过 移动 操作 来 设置 。 表 达 式 评估 到 它们 的 “自然 ” 寄 
| 存 器 中 ， 然 后 它们 被 移 到 一 个 变量 。 | [234 

4) 只 要 出 现 到 内 存 的 存储 操作 (在 ILOC 中 为 store rmi 一 rj)， 在 其 后 立即 加 入 一 个 从 六 到 这 个 
变量 的 虚拟 寄存 器 的 一 个 拷贝 。( 规 则 1 表明 从 该 位 置 的 装 入 总 是 以 同一 寄存 器 为 目标 。 这 一 规则 保 
| 证 每 当 变量 的 内 存 位 置 更 新 时 ， 变 量 的 寄存 器 也 被 更 新 。) 
! 这 种 名 字 空 间 方 案 对 SVD 来 说 大 约 使 用 90 个 名 字 ， 但 是 给 出 了 依据 第 一 个 名 字 空 间 方案 而 建立 
| 的 所 有 优化 。 直 到 我 们 采用 SSA 形 式 为 止 ， 编 译 器 一 直 使 用 这 些 规则 ， 而 SSA 形 式 有 它 自 己 的 命名 





5.6.2 内 存 模型 


正如 命名 临时 值 的 机 制 可 以 对 程序 的 信 版 本 表示 的 信息 产生 影响 一 样 ,编译 器 对 每 个 值 选 择 存储 位 
置 的 方法 也 产生 影响 。 对 于 代码 中 计算 的 每 一 个 值 ， 编 译 器 必须 决定 这 个 值 的 驻 留 位 置 。 对 于 要 执行 的 
代码 ， 编 译 器 必须 指定 特定 的 位 置 ， 诸 如 寄存 器 mi 或 距离 标签 L10089 16 字 节 的 位 置 等 。 然 而 ， 在 代码 生 
成 的 最 后 阶段 之 前 ， 编译 器 可 以 使 用 描绘 内 存 谱系 中 的 层次 ， 例如 寄存 器 或 内 存 的 符号 地 址 ， 而 不 是 描 
绘 那个 层次 中 的 特定 位 置 。 

考虑 本 书 所 使 用 的 ILOC 例 子 。 符 号 内 存 地 址 由 在 它 的 前 面 的 加 上 字符 @ 来 表示 。 因 此 ，@x 是 x 在 包 
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含 它 的 存储 域 中 距离 开始 点 的 x 的 偏 移 量 。 因 为 rsp 存放 活动 记录 指针 ， 所 以 使 用 @x 和 r,s 计算 地 址 的 操 
作 隐 式 取决 于 把 变量 x 存储 在 为 当前 过 程 的 活动 记录 而 被 保留 的 内 存 中 的 决策 。 

编译 器 通常 工作 于 下 面 两 个 内 存 模型 中 的 一 个 。 

1) 寄存 器 到 寄存 器 模型 (Register-to-Register Model) 在 这 一 模型 下 ， 编 译 器 尽量 把 值 保存 在 寄存 

235) ”器 内 ， 而 忽视 机 器 的 物理 寄存 器 单元 所 带 来 的 任意 限制 。 所 有 可 以 在 其 生存 期 的 大 部 分 时 间 都 合法 地 保 

存在 寄存 器 中 的 值 都 被 保存 在 寄存 器 中 。 只 有 当 程序 的 语义 需要 将 一 个 值 存储 到 内 存 中 时 ， 它 才 被 存储 
到 内 存 。 例 如 ， 在 过 程 调用 时 ， 地 址 被 当 作 参 数 而 传送 给 被 调用 过 程 的 所 有 局 部 变量 都 必须 被 存 回 内 存 
中 。 不 是 生命 期 的 大 部 分 时 间 都 能 保存 在 寄存 器 中 的 值 被 存储 在 内 存 中 。 对 于 这 样 的 值 ， 编 译 器 生成 在 
每 一 次 它 被 计算 使 存储 它 的 值 并 在 每 一 次 使 用 时 装 入 它 的 值 的 代码 。 

2) 内 存 到 内 存 模 型 (Memory-to-Memory Model) 在 这 一 模型 下 ， 编 译 器 假设 所 有 值 都 存放 在 内 存 
单元 中 。 值 在 使 用 前 从 内 存 移 到 一 个 寄存 器 中 。 值 在 定义 之 后 立即 从 寄存 器 移 到 内 存 中 。 与 寄存 器 到 寄 
存 器 模型 相 比 ， 在 这 一 模型 中 ， 代 码 的 耻 形 式 中 命名 的 寄存 器 数目 要 少 。 在 这 一 模型 中 ， 设 计 者 也 许 会 
发 现在 下 中 加 入 内 存 到 内 存 操作 的 价值 ， 例 如 内 存 到 内 存 加 法 的 价值 。 

内 存 模型 的 选择 与 IR 的 选择 总 体 上 是 互 不 相关 的 。 编 译 器 设计 者 可 以 构建 内 存 到 内 存 AST 或 内 存 到 
内 存 ILOC， 也 可 以 构建 相应 的 寄存 器 到 寄存 器 版 本 ， 二 者 的 难 易 程度 相同 。( 栈 机 器 代码 和 累加 器 机 器 
的 代码 也 许 不 在 此 列 ; 它们 包含 它们 独 有 的 内 存 模型 。) 

内 存 模型 的 选择 对 编译 器 的 其 他 部 分 产生 影响 。 对 于 寄存 器 到 寄存 器 模型 ， 编 译 器 典型 地 使 用 的 寄 
存 器 数目 比 目 标 机 器 所 能 提供 的 数目 多 。 因 此 ， 寄 存 器 分 配器 必须 把 蔗 程 序 中 的 虚拟 寄存 器 映射 到 目标 
机 器 所 提供 的 物理 寄存 器 上 。 这 通常 需要 插入 额外 的 装 入 、 存 储 和 拷贝 等 操作 ， 因 而 使 得 代码 变 慢 、 变 
大 。 然 而 对 于 内 存 到 内 存 模型 ， 代 码 的 IR 版 使 用 的 寄存 器 数目 通常 比 现代 处 理 器 所 提供 的 寄存 器 数目 少 。 
在 这 里 ， 寄 存 器 分 配器 寻找 可 以 长 时 间 保存 在 寄存 器 中 的 基于 内 存 的 值 。 在 这 一 模型 中 ， 通 过 消去 装 人 
和 存储 ， 分 配器 使 得 代码 更 快 、 更 小 。 

RISC 机 器 的 编译 器 往往 使 用 寄存 器 到 寄存 器 模型 ， 这 基于 两 个 原因 。 第 一 ， 寄 存 器 到 寄存 器 模型 更 
能 够 反映 RISC 体 系 结构 的 程序 设计 模型 。RISC 机 器 不 具备 完整 的 内 存 到 内 存 操作 ， 相 反 ， 它 们 隐 式 地 
假设 值 可 以 保存 在 寄存 器 中 。 第 二 ， 寄 存 器 到 寄存 器 模型 允许 编译 器 在 IR 中 直接 描绘 它 得 到 的 某 些微 妙 
的 事实 。 值 保存 在 寄存 器 内 这 一 事实 意味 着 编译 器 在 早 前 已 经 证 明了 把 这 个 值 保 存在 寄存 器 是 安全 的 ©。 

[236] 除非 编译 器 在 IR 中 描绘 这 些 事实 ， 编 译 器 将 需要 -再 证 明 这 -一 事实 。 


本 书 所 用 的 ILOC 是 从 称 为 ILOC 9X 的 蔗 中 抽象 出 来 的 。ILOC 9X 用 于 Rice 大 学 的 研究 用 编译 器 | 


项 目 中 。ILOC 9X 包 括 编译 器 用 于 描绘 关于 值 的 信息 的 内 存 操作 的 层次 结构 。 在 这 一 层次 结构 的 底 
部 ， 编 译 器 对 值 只 有 很 少 的 信息 或 没有 信息 ; 在 层次 结构 的 顶部 ， 编 译 器 知道 真正 的 值 。 这 些 操作 
如 下 所 示 : | 





日 、 如 果 编 译 器 能 够 证 明 只 有 一 个 名 字 对 某 个 值 提 供 存 取 ， 那 么 它 就 可 以 把 这 个 值 保存 在 寄存 器 中 。 如 果 存 在 
多 个 名 字 ， 那 么 编译 器 必须 小 心 ， 并 把 这 个 值 保存 在 内 存 中 。 例 如 ， 一 个 局 部 变量 x 可 以 保存 在 寄存 器 中 ， 
除非 它 可 以 被 另外 一 个 作用 域 的 代码 引用 。 在 诸如 Pascal 和 Ada 这 样 的 支持 嵌 套 作用 域 的 语言 中 ， 这 样 的 引 
用 可 以 出 现在 戏 套 过 程 中 。 在 C 语 言 中 ， 如 果 程 序 取 x 的 地 址 &x 并 通过 这 个 地 址 存 取 这 个 值 ， 就 可 能 出 现 这 
一 情况 。 在 Algol 和 PL/I 中 ， 程 序 可 以 把 x 当 作 引用 参数 传送 给 另外 一 个 过 程 。 
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ff 
立即 装 入 把 已 知 的 常量 值 装 入 到 寄存 器 
无 变化 装 人 装 入 一 个 在 运行 中 不 发 生变 化 的 值 。 编 译 器 不 知道 这 个 值 ， 但 是 可 以 证 明 它 不 
是 由 程序 的 操作 定义 的 
标量 装 人 及 存储 对 标量 的 操作 ， 被 操作 值 不 是 数组 元 素 、 结 构 元 素 或 基于 指针 的 值 
一 般 装 入 及 存储 对 可 以 是 数组 元 素 、 结 构 元 素 或 基于 指针 的 值 的 操作 。 这 是 一 般 情 况 的 操作 















通过 使 用 这 一 层次 结构 ， 前 端 可 以 把 关于 目标 值 的 信息 直接 编码 到 ILOC 9X 代 码 。 在 其 他 遍 发 
现 附加 信息 时 ， 它 们 可 以 把 值 的 较 一 般 的 装 和 操作 重 写 成 更 特别 的 形式 。 如 果 编 译 器 发 现 某 个 值 是 
已 知 常量 ， 它 可 以 用 这 个 值 的 立即 装 入 来 取代 一 般 装 入 或 标量 装 和 人 。 如 果 定 义 和 使 用 的 分 析 发 现 某 
个 位 置 不 能 被 任何 可 执行 存储 操作 所 定义 ， 那么 这 个 值 的 装 入 可 以 重 写成 无 变化 装 入 。 

优化 可 以 利用 以 这 种 形式 描绘 的 信息 。 例 如 ， 无 变化 装 入 的 结果 与 常量 的 比较 本 身 一 定 是 不 变 
的 。 这 是 一 个 使 用 标量 装 和 信和 一 般 装 入 难以 证 明 或 不 能 证 明 的 事实 。 







5.7 符号 表 


作为 翻译 的 一 部 分 ， 编 译 器 得 到 有 关 被 翻译 程序 要 处 理 的 各 个 条 目的 信息 。 它 必须 发 现 并 存储 许多 
不 同 种 类 的 信息 。 它 遇 到 各 种 各 样 的 名 字 ， 包 括 变 量 、 被 定义 常量 、 过 程 、 函 数 、 标 签 、 结 构 和 文件 。 
正如 前 面 一 节 所 讨论 的 那样 ， 编 译 器 还 生成 很 多 名 字 。 对 于 一 个 变量 ， 编 译 器 需要 知道 它 的 数据 类 型 、 
存储 分 类 、 名 字 和 它 的 声明 过 程 的 词法 级 别 以 及 在 内 存 中 的 基地 址 和 偏 移 量 。 对 于 一 个 数组 ， 编 译 器 还 
需要 知道 维 数 以 及 每 一 个 维 数 的 上 界 和 下 界 。 对 于 记录 或 结构 ， 编 译 器 需要 知道 域 的 列表 ， 以 及 每 个 域 
的 相关 信息 。 对 于 函数 和 过 程 ， 编 译 器 需要 知道 它 的 参数 的 数目 和 各 参数 的 类 型 ， 以 及 返回 值 的 类 型 ; 
更 精密 的 翻译 也 许 要 记录 一 个 过 程 可 以 引用 或 修改 的 变量 的 信息 。 

编译 器 必须 或 者 在 IR 中 记录 这 一 信息 ， 或 者 根据 需要 重新 得 到 它 。 出 于 效率 的 原因 ， 大 多 数 编译 器 
记录 事实 而 不 是 重新 计算 这 些 事实 5 。 这 些 事实 可 以 直接 记录 在 了 及 中 。 例 如 ， 构 建 AST 的 编译 器 也 许 要 
作为 注释 (或 属性 ) 在 表示 变量 声明 的 结 点 记录 该 变量 的 信息 。 这 一 方法 的 优点 在 于 ，. 它 为 被 编译 代码 
使 用 单一 表示 。 它 提供 统一 的 存 取 方 法 和 单一 的 实现 。 这 一 方法 的 缺点 在 于 ， 这 单一 的 存 取 方 法 可 能 是 
低 效 的 ， 导 航 AST 寻 找 适当 的 声明 有 其 自身 的 代价 。 为 了 消除 这 种 低 效 性 ， 编 译 器 可 以 遍历 IR 使 得 每 一 
个 引用 都 有 一 个 指向 相应 声明 的 链 结 。 这 会 增加 IR 的 空间 和 IR 构 建 器 的 开销 。 

如 我 们 在 第 4 章 中 已 看 到 的 那样 ， 另 一 个 选择 是 为 这 些 事实 创建 一 个 中 心 存储 宝 并 提供 对 它 的 有 效 
存 取 。 被 称 为 符号 表 的 这 一 中 心 存储 室 成 为 编译 器 IR 的 一 个 主要 部 分 。 符 号 表 局 部 化 从 源 代码 的 可 能 不 
同 部 分 得 到 的 信息 。 符 号 表 使 得 我 们 能 够 容易 、 高 效 地 使 用 这 样 的 信息 ， 它 简化 必须 引用 在 编译 的 早期 
阶段 得 到 变量 信息 的 所 有 代码 的 设计 与 实现 。 它 避免 通过 搜寻 IR 来 寻找 表示 变量 声明 的 部 分 所 带 来 的 消 
HE: 使 用 符号 表 通 常 可 以 消除 直接 在 下 中 表示 声明 的 必要 性 。( 源 代码 到 源 代 码 的 翻译 是 一 个 例外 。 编 
译 器 可 以 为 了 效率 而 构建 符号 表 ， 并 在 IR 中 保存 声明 的 语法 ， 这 样 编译 器 就 能 够 生成 与 输入 程序 极为 相 
似 的 输出 程序 。) 符号 表 消 除 让 每 一 个 引用 包含 指向 声明 的 指针 的 开销 。 它 使 用 一 个 从 文本 名 字 到 存储 
信息 的 计算 映射 来 取代 这 些 指针 。 因 此 ， 在 某 种 程度 上 ， 符 号 表 就 是 一 种 高 效 处 理 。 

O 这 一 规则 的 一 个 通用 例外 发 生 于 把 豚 写 到 外 部 存储 器 时 。 与 计算 相 比 ， 这 样 的 IO 活动 是 代价 高 昂 的 ， 而 且 


当 编译 器 读 取信 息 时 ， 它 在 IR 上 做 一 个 完整 的 遍 。 对 于 某 些 信息 来 说 ， 重 新 计算 比 把 它们 写 到 外 部 存储 器 
然后 再 读 回来 代价 更 低 。 
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在 本 书 的 很 多 地 方 ， 我 们 都 使 用 “这 一 符号 表 (the symbol table)。” 正 如 我 们 将 在 5.7.4 节 中 看 到 
的 那样 ， 编 译 器 可 以 包含 若干 不 同 、 特 化 的 符号 表 。 细 心 的 实现 可 以 对 所 有 这 些 表格 使 用 相同 的 存 取 
方法 。 

符号 表 实 现 需要 留意 细节 。 因 为 几乎 翻译 的 方方面面 都 引用 符号 表 ， 存 取 的 高 效 性 是 至 关 重 要 的 。 
因为 在 翻译 前 编译 器 不 能 预测 它 将 遇 到 的 名 字 的 数目 ， 扩 展 符号 表 的 操作 必须 既 要 适度 又 要 高 效 。 本 节 
对 在 设计 符号 表 中 出 现 的 问题 提供 高 级 别 的 处 理 。 它 从 编译 器 的 特定 观点 展示 符号 表 的 设计 与 使 用 。 对 
于 更 深层 的 实现 细节 和 设计 选择 请 参见 附录 B 的 B.4 节 。 


5.7.1 NIR 


符号 表 的 设计 中 最 重要 的 问题 是 效率 。 编 译 器 会 经 常 存 取 符号 表 。 因 
为 散 列表 提供 常量 期 待 查找 时 间 ， 所 以 散 列表 是 实现 符号 表 的 选择 。 从 概 
念 上 讲 散 列表 是 一 流 的 。 它 们 使 用 散 列 函数 (hash function) h 把 名 字 映 射 
到 小 整数 上 ， 并 使 用 这 个 小 整数 作为 这 个 表 的 索引 。 使 用 散 列 符号 表 ， 给 
定名 字 ?， 编 译 器 在 表 中 位 置 〈 槽 ) h(n) 存放 该 名 字 的 所 有 信息 。 图 5-9 给 
出 一 个 简单 的 十 槽 散 列表 。 这 一 散 列 表 是 记录 的 一 个 向 量 ， 每 个 记录 保存 
编译 器 生成 的 单一 名 字 的 描述 。 名 字 a、b 和 c 已 经 被 插入 表 中 。 名 字 d 正 在 ”图 5-9 散 列表 实现 概念 图 
被 插入 表 中 Ad) = 2 处 。 

使 用 散 列表 的 主要 原因 是 提供 以 文本 名 字 为 关键 字 的 常量 期 待 时 间 查 找 。 为 了 达到 这 一 查找 期 待 值 ， 
的 计算 代价 必须 很 低 。 给 定 一 个 适当 的 函数 4”， 存 取 n 的 记录 需要 计算 h(n) 并 索引 到 表 中 h(n) 的 位 置 。 
如 果 h 把 两 个 或 多 个 符号 映射 到 相同 的 小 整数 上 ， 就 会 出 现 一 个 “冲突 ”"。( 图 5-9 中 ， 如 果 h(n)=3， 就 会 
发 生 这 一 情况 . ) 实现 必须 很 好 地 处 理 这 一 情况 ， 保 留 所 需 的 所 有 信息 并 维持 查找 时 间 。 本 节 假 设 h 是 完 
全 散 列 函数 ， 也 就 是 说 ， 这 一 函数 从 不 产生 冲突 。 另 外 ， 我 们 假设 编译 器 事先 知道 做 一 个 多 大 的 表 。 
B.4 节 更 加 详细 地 描述 散 列表 的 实现 ， 包 括 散 列 和 函数、 冲突 处 理 和 扩展 散 列表 的 方案 。 

散 列表 有 时 用 作 稀 朴 图 的 高 效 表示 。 给 定 两 个 结 点 x 和 y， 对 应 于 关键 字 xy 的 入 口 表 示 存 在 从 x 到 的 
边 。( 这 需要 一 个 从 小 整数 对 生成 良好 分 布 的 散 列国 数 ， 附 录 B 的 B.4 节 中 所 描述 的 常量 乘积 取 模 散 列 函 
SAG AG RABE.) 有 和 良好 实现 的 散 列表 可 以 提供 快速 插入 和 特定 边 存在 性 的 快速 测试 。 但 回 
答 诸如 “什么 样 的 结 点 与 x 相 邻 ”等 问题 则 需要 额外 的 信息 。 








| 散 列 的 替代 . 
散 列 是 组 织 编译 器 的 符号 表 中 最 为 广泛 运用 的 方法 。 多 重 集 判 别 是 另 一 个 吸引 人 的 选择 。 它 消 | 
除 所 有 最 坏 情 况 行 为 的 可 能 。 多 重 集 判 别 的 关键 思路 是 在 扫描 器 中 可 以 离线 构建 索引 。 | 
| 为 了 在 符号 表 使 用 多 重 集 判别 ， 编 译 器 设计 者 必须 采用 不 同 的 扫描 方法 。 编 译 器 不 是 逐步 地 处 | 
理 输 入 ， 而 是 扫描 整个 程序 来 寻找 标识 符 的 完全 集合 。 当 编译 器 发 现 一 个 标识 符 时 ， 它 创建 一 个 二 | 
元 组 <name, position>， 其 中 name 是 标识 符 的 文本 ， 而 position 是 这 一 标识 符 在 所 有 记号 列表 中 的 序 
| 位 。 编 译 器 把 所 有 这 样 的 二 元 组 放 入 一 个 大 集合 。 
下 一 个 步 又 是 按 字 典 序 对 这 一 集合 进行 排序 。 它 的 效果 是 生成 一 个 子 集 的 集合 ， 每 一 个 子 集 对 
应 一 个 标识 符 。 这 些 子 集中 的 每 一 个 都 拥有 相应 标识 符 的 所 有 出 现 的 二 元 组 。 因 为 每 一 个 二 元 组 通 | 
过 它 的 position 值 与 一 个 特定 的 记号 相关 联 , 所 以 编译 器 可 以 使 用 这 个 已 排序 的 集合 重 写 这 一 记号 流 。| 
它 线 性 扫描 这 个 集合 ， 按 顺序 处 理 每 一 个 子 集 。 编 译 器 为 整个 子 集 分 配 一 个 符号 表 索 引 ， 然 后 重 写 | 
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| 记号 使 其 包含 这 一 索引 。 这 把 标识 符 记号 在 符号 表 的 索引 附加 到 该 记号 中 如 果 编译 器 需要 一 个 文 
本 查找 函数 ， 可 以 使 用 二 分 查找 ， 因 为 排序 的 结果 是 按 字 母 顺 序 排列 的 。 


使 用 这 一 技术 的 代价 是 对 记号 流 的 额外 一 次 遍历 ， 加 上 按 字典 序 排 序 的 代价 。 从 复杂 性 的 观点 
看 ， 使 用 这 一 技术 的 优点 是 它 避 免 了 散 列 方法 的 最 坏 情 况 行为 的 可 能 ， 而 且 在 分 析 前 就 使 符号 表 的 
彻 始 大 小 一 目 TR. 在 离线 的 解决 方案 可 行 的 绝 大 多 数 应 用 中 ， 这 一 技术 都 可 以 用 于 到 代 散 列表 。 | 





5.7.2 构建 符号 表 


符号 表 为 编译 器 的 其 余部 分 定义 两 个 接口 过 程 。 

(1) TookUp(name) 

如 果 在 表 中 h(name) 处 存在 记录 ， 则 返回 该 记录 。 和 否则 ,返回 一 个 表明 没有 找到 mame 的 值 。 

(2) insert(name, record) 

把 信息 存储 于 表 中 h(name) 处 的 record 中 。 它 可 以 扩充 这 个 表 以 便 容纳 name 的 记录 。 
编译 器 可 以 分 别 实现 100kUp 和 insert 的 功能 ， 也 可 以 通过 向 Jookup 传 送 一 个 描述 是 否 插入 这 个 名 字 的 
标识 来 把 它们 结合 起 来 。 它 需要 保证 未 声明 变量 的 JookUp 将 会 失败 ， 这 是 发 现 违背 语法 制导 翻译 的 使 用 
前 声明 规则 的 一 个 有 用 性 质 ， 也 是 支持 由 套 词法 作用 域 的 一 个 有 用 性 质 。 

这 一 简单 的 接口 程序 正好 适合 在 第 4 章 中 所 描述 的 特定 语法 制导 翻译 方案 。 在 处 理 声明 的 语法 中 ， 
编译 器 给 每 一 个 变量 构建 一 个 属性 集合 。 当 语法 分 析 器 识别 声明 某 个 变量 的 产生 式 时 ， 语 法 分 析 器 可 以 
使 用 insert 把 这 个 名 字 及 其 属性 加 入 到 符号 表 。 如 果 一 个 变量 名 只 能 在 一 个 声明 中 出 现 ， 那 么 语法 分 析 
器 可 以 首先 调用 700kUp 去 检查 这 个 名 字 是 否 被 重复 使 用 。 当 语法 分 析 器 在 声明 的 语法 之 外 过 到 变量 名 时 ， 
语法 分 析 器 使 用 7ookUp 从 符号 表 中 得 到 适当 的 信息 。7ookUp 对 于 任意 未 声明 的 变量 名 返回 失败 。 当 然 ， 
编译 器 设计 者 也 许 需要 加 入 初始 化 这 个 表 、 将 表 存 储 于 外 部 设备 、 从 外 部 设备 重新 得 到 表 以 及 最 后 确定 
该 表 的 函数 。 对 于 带 有 单一 名 字 空 间 的 语言 ， 这 一 接口 程序 就 足够 了 。 


5.7.3 处 理 嵌 套 作 用 域 


只 有 少数 程序 设计 语言 只 提供 一 个 集成 名 字 空 间 。 一 个 语言 通常 允许 程序 在 多 个 层次 上 声明 名 字 。 
这 些 层次 中 的 每 一 个 都 有 一 个 作用 域 (scope)， 即 可 以 使 用 该 名 字 的 程序 文本 中 的 区 域 。 这 些 层 次 中 的 
每 一 个 都 有 一 个 生存 期 (lifetime )， 即 该 名 字 具 有 值 的 程序 执行 中 的 一 个 期 间 。 

如 果 源 语言 允许 作用 域 彼 此 嵌 套 ， 那 么 前 端 需要 把 诸如 x 的 引用 转化 到 正确 的 作用 域 和 生存 期 的 机 
制 。 编 译 器 用 于 实现 这 一 转化 的 主要 机 制 是 一 个 作用 域 化 了 的 符号 表 。 

为 了 这 一 讨论 目的 ， 我 们 假设 程序 可 以 创建 任意 多 个 相互 嵌 套 的 作用 域 。 我 们 对 词法 作用 域 的 更 深 
入 的 讨论 推迟 到 6.3.1 节 ; 然而 ， 大 多 数 程序 员 对 这 里 讨论 的 概念 有 足够 多 的 经 验 。 图 5-10 给 出 一 个 创建 
五 个 不 同 作用 域 的 C 语 言 程 序 。 我 们 将 用 表示 它们 彼此 间 的 嵌 套 关系 的 数字 对 这 些 辖 域 做 标签 。level 0 
的 作用 域 是 最 外 层 的 作用 域 ， 而 level 3 的 作用 域 是 最 内 层 的 作用 域 。 

上 图 右 侧 的 表格 给 出 了 在 各 作用 域 中 声明 的 名 字 。 在 level 2a 中 的 b 的 声明 在 生成 level 2a 的 模块 内 部 
隐藏 了 level 1 中 的 b 的 声明 。 在 level 2 中 ，b 的 引用 重新 引用 level 1 的 参数 。 同 样 地 ，level 25 内 的 a 和 x 的 
声明 隐藏 它们 早先 〈 分 别 在 level 1 和 level 0 处 ) 的 声明 。 

这 一 上 下 文 关系 创建 执行 赋值 语句 的 名 字 环 境 。 用 下 标 表示 名 字 的 层次 ， 我 们 发 现 level 3 的 赋值 
意 指 : 


bi = az + by + C3 + Wo 
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static int w; /* levelo */ 
int x; 


void example(int a, int b) { 
int c; /* levell */ 





int b, 2; /* level2a */ 


} 
{ 
int a, x; /* level 2b */ 











int c, x; /* level3 */ 
b=atbtct+w; 





图 5-10 C 语 言 中 简单 词法 作用 域 示 例 


iE Rik — RAT HEE level 2a 中 声明 的 名 字 ， 因 为 这 个 块 已 经 在 level 25 打 开 之 前 关闭 了 。 

为 了 编译 包含 嵌 套 作用 域 的 程序 ， 编 译 器 必须 把 每 个 变量 的 引用 映射 到 它 的 特定 声明 。 这 一 过 程 被 
RAL FM (name resolution ) ， 它 把 每 个 引用 映射 到 它 所 声明 的 词法 层次 上 。 编 译 器 用 于 完成 这 一 名 
字 分 解 的 机 制 是 在 词法 上 作用 域 化 了 的 符号 表 。 本 节 其 余部 分 将 描述 词法 作用 域 化 符号 表 的 设计 和 实现 。 
相应 的 运行 时 机 制 将 在 6.5.2 节 描述 ， 该 机 制 将 引用 的 词法 层次 转化 成 地 址 。 作 用 域 化 符号 表 在 代码 优化 
中 也 有 直接 的 应 用 。 例 如 ，8.5.1 节 描述 的 超 局 部 值 编号 算法 的 效率 取决 于 作用 域 化 散 列表 。 


1. 概念 

为 了 管理 捞 套 作用 域 ， 分 析 器 必须 稍微 改变 一 下 它 对 符号 表 的 管理 方法 。 分 析 器 每 次 进入 一 个 新 的 
词法 作用 域 时 ， 它 可 以 为 该 作用 域 创建 一 个 新 的 符号 表 。 当 它 遇 到 这 一 作用 域内 的 声明 时 ， 它 把 信息 加 
入 到 当前 的 符号 表 。Insert 在 当前 符号 表 上 进行 操作 。 当 它 遇 到 一 个 变量 引用 时 ，7ookUp 必 须 首先 检查 
当前 作用 焉 的 符号 表 。 如 果 当 前 符号 表 没 有 这 一 名 字 的 声明 ， 那 么 它 检查 周围 作用 域 的 符号 表 9 。 通 过 
这 样 对 相继 的 较 低 词法 层次 的 符号 表 依 次 进行 搜索 ， 分 析 器 或 者 找到 这 一 名 字 的 最 邻近 的 声明 ， 或 者 在 
最 外 层 的 作用 域内 失败 ， 失 几 表 明 这 一 变量 在 当前 的 辖 域内 没有 可 视 的 声明 。 

图 5-11 给 出 以 这 种 方式 为 我 们 的 示例 程序 构建 的 符号 表 ， 这 时 分 析 器 位 于 赋值 语句 处 。 当 编译 器 为 
名 字 b 调 用 修改 后 的 100kUp 函 数 时 ， 它 将 在 level 3 失败 ， 在 level 2 失败 ， 并 在 level 1 找到 这 个 名 字 。 这 与 
我 们 对 程序 的 理解 一 致 ， 示 例 中 b 的 最 邻近 的 声明 是 level 1 中 的 参数 。 因 为 在 level 2 中 的 第 一 个 模块 2 已 


` 经 关闭 ， 它 的 符号 表 不 在 搜索 链 中 。 找 到 这 一 符号 的 这 一 层次 形成 b 的 地 址 的 第 一 部 分 ， 在 此 例 中 就 是 


level 1。 如 果 符 号 表 中 的 记录 包含 每 个 变量 的 存储 偏 移 ，、 那 么 序 对 <level, offset> 描 述 在 内 存 的 什么 位 置 
可 以 找到 b: 它 在 距离 level 作 用 域 存储 区 开始 位 置 offset 的 位 置 。 我 们 称 这 个 序 对 为 b 的 静态 坐标 。 

2. 细节 

为 了 处 理 这 一 方案 ， 需 要 两 个 额外 的 调用 。 为 了 每 一 个 作用 域 ， 编 译 器 需要 一 个 初始 化 符号 表 和 确 
定 符 号 表 的 调用 。 | 

. (1) initializeScope() 

递增 当前 层次 并 为 这 一 层次 创建 一 个 新 的 符号 表 。 它 把 这 个 新 表 与 前 面 层次 的 符号 表 连 结 起 来 并 更 
新 1ookUp 和 insert 所 使 用 的 当前 层次 指针 。 


” 指 的 是 当前 符号 表 所 涉及 层次 的 上 一 层次 的 符号 表 。 一 一 译 者 注 
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(2) finalizeScope() 


改变 当前 层次 指针 使 其 指向 包围 当前 层次 的 作用 域 的 符号 表 ， 然 后 降低 当前 层次 。 如 果 编 译 器 需要 
保存 后 来 还 要 使 用 的 层次 相关 的 符号 表 ， 那 么 fina11zeScope 或 者 把 这 一 符号 表 完 全 留 在 内 存 中 ， 或 者 


把 它 写 到 外 部 设备 上 并 收回 它 的 空间 。 


为 了 对 词法 作用 域 进行 计数 , 每 当 分 析 器 进入 一 个 新 的 词法 作用 域 时 , 它 都 要 调用 init1a1izeScope， 


并 当 它 离开 一 个 词法 作用 域 时 调用 finaJ17zeScope。 
使 用 这 一 接口 ， 图 5-10 中 的 程序 将 产生 下 面 一 


1. InitializeScope 10. insert(b) 
2. Insert(w) 11. Insert(z) 
3. Insert(x) 12. FinalizeScope 
4. Insert(examp1e) 13. InitializeScope 
5. InitializeScope 14. Insert(a) 
6. Insert(a) 15. Insert(x) 
7. Insert(b) 16. InitializeScope 
8. Insert(c) 17. insert(c) 
9. initializeScope 18. Insert(x) 


当 编 译 器 进入 每 个 作用 域 时 ， 它 调用 jinitia] 
表 上 。 当 编译 器 离开 给 定 作用 域 时 ， 它 调用 finay 


系列 调用 : 


19. LookUp(b) 
20. LookUp(a) 
21. LookUp(b) 
22. LookUp(c) 
23. LookUp(w) 
24. FinalizeScope 
25. FinalizeScope 
26. FinalizeScope 


izeScope。 编 译 器 使 用 insert 把 每 个 名 字 加 到 该 符号 
izeScope 丢 弃 访 作用 域 的 声明 。 对 于 示例 中 的 赋值 语 


句 ， 编 译 器 检查 每 一 个 遇 到 的 名 字 。( Jookup 调 用 的 顺序 会 依赖 于 遍历 赋值 语句 的 方式 而 变化 。) 
如 果 fFinalizeScope 将 已 中 止 层次 的 符号 表 保 留 在 内 存 中 ， 那 么 这 些 调用 的 实际 结果 将 是 图 5-12 给 
出 的 符号 表 。 当 前 层次 指针 被 设置 成 指向 一 个 无 效 值 。 所 有 层次 的 符号 表 被 留 在 内 存 中 ， 并 被 链接 到 





层次 0 


层次 1 


图 5-12 示例 程序 的 最 终 符 号 表 
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一 起 以 反映 词法 能 套 。 通 过 在 每 一 个 新 层次 的 开始 处 在 I 了 R 中 存储 指向 相应 符号 表 的 指针 ， 编 译 器 可 以 
使 其 后 继 遍 存 取 相关 符号 表 的 信息 。 这 样 做 的 另 一 个 好 处 是 ， 了 中 的 标识 符 可 以 直接 指向 它们 在 符号 
表 的 入 口 。 


5.7.4 符号 表 的 多 种 运用 


前 面 的 讨论 集中 于 一 个 中 心 符号 表 ， 虽 然 它 也 许 是 由 儿 个 符号 表 组 成 的 。 实 际 中 ， 编 译 器 为 不 同 目 
的 构建 多 个 符号 表 。 ` 

1. 结构 表 

用 于 对 结构 或 记录 中 的 域 命名 的 文本 串 出 现 于 与 变量 和 程序 的 不 同 的 名 字 空 间 。 名 字 Size 可 能 出 现 
于 一 个 程序 中 的 若干 不 同 的 结构 中 。 诸 如 C 语 言 或 Ada 语 言 这 样 把 size 用 作 结 构 中 的 域 的 很 多 程序 设计 
语言 不 排除 把 size 当 作 变 量 名 或 函数 名 来 使 用 。 

对 于 一 个 结构 中 的 每 个 域 ， 编 译 器 需要 记录 它 的 类 型 、 它 的 大 小 以 及 它 在 这 一 记录 中 的 偏 移 。 编 译 
器 通过 使 用 处 理 变量 声明 同样 的 机 制 来 收集 来 自 这 些 声明 的 信息 。 它 还 必须 确定 这 一 结构 的 总 体 大 小 ， 
通常 这 一 大 小 被 计算 成 各 域 大 小 的 总 和 ， 再 加 上 运行 时 系统 所 需要 的 系统 负荷 空间 。 

存在 若干 处 理 域名 的 名 字 空间 的 方法 : 

(1) 分 离 表 (separate table) 

编译 器 可 以 为 每 个 记录 定义 维护 一 个 分 离 的 符号 表 。 概 念 上 ， 这 是 一 个 非常 清晰 的 想法 。 如 果 使 用 
多 个 表 的 系统 负荷 很 小 ， 正 如 大 多 数 面向 对 象 的 实现 那样 ， 那 么 使 用 分 离 表 并 把 它们 与 这 一 结构 名 的 符 
号 表 入 口 关联 起 来 是 有 意义 的 。 

(2) 筛选 器 表 (selector table) 

编译 器 可 以 为 域名 字 维 护 一 个 分 离 表 。 为 了 避免 由 于 不 同 结构 中 使 用 相同 名 字 的 域 造 成 的 冲突 ， 
编译 器 必须 使 用 限定 名 : 将 或 者 这 一 结构 的 名 字 或 者 惟一 映射 到 这 一 结构 的 某 种 东西 ， 如 结构 名 的 符 


号 表 索 引 等 ， 与 域名 相 联结 。 在 这 一 方法 中 ,编译 器 必须 以 某 种 方式 把 与 每 一 个 结构 相关 的 各 个 域 连 


结 起 来 。 . 

(3) 统一 表 (unified table) 

编译 器 可 以 通过 使 用 限定 名 把 域名 存储 在 它 的 主 符号 表 内 。 这 减少 表 的 数量 ， 但 是 也 意味 着 主 符号 
表 必 须 支持 变量 和 函数 所 需要 的 所 有 域 ， 以 及 支持 在 结构 中 每 一 个 域 第 选 器 所 需要 的 域 。 在 以 上 这 三 个 
方法 中 ， 这 个 方法 可 能 最 不 具 吸 引力 。 

分 离 表 方法 有 这 样 的 优势 : 例如 ， 收 回 与 结构 相关 的 符号 表 时 ， 它 很 自然 地 适合 于 主 符号 表 的 作用 
域 管理 框架 。 当 发 现 一 个 结构 时 ， 它 的 内 部 符号 表 易 于 通过 相应 的 结构 记录 存 取 。 

在 后 面 两 个 方案 中 ， 编 译 器 将 需要 对 作用 域 问题 非常 小 心 。 例 如 ， 如 果 当 前 作用 域 声 明 一 个 结构 
fee， 而 外 部 作用 域 已 定义 了 fee， 那 么 作用 域 机 制 必 须 正确 地 把 fee 映 射 到 这 一 结构 上 【〔 以 及 它 的 对 应 
域 的 入 口 )。 这 可 能 使 得 限定 名 的 创建 更 加 复杂 。 如 果 代 码 包 含 两 个 fee 的 定义 ， 且 每 一 个 定义 都 有 一 个 
域名 size， 那 么 fee.size 不 是 任意 域 人 口 的 惟一 关键 字 。 通 常 可 以 通过 把 由 全 局 计数 器 生成 的 惟一 整数 
与 每 一 个 结构 名 相关 联 来 解决 这 一 问题 。 

2. 面向 对 象 语言 中 的 名 字 解 析 链 表 

在 面向 对 象 语 言 中 ， 名 字 作 用 域 规则 在 受到 代码 结构 的 控制 的 同时 ， 在 同等 程度 上 受 数 据 结构 的 控 
制 。 这 导致 一 组 更 加 复杂 的 规则 ; 这 也 导致 一 组 更 复杂 的 符号 表 。 例 如 ，Java 语 言 需要 同时 为 被 编译 代 
码 ， 为 代码 中 已 知 和 被 引用 的 任意 外 部 类 ， 以 及 为 包含 这 一 代码 的 类 的 继承 层次 准备 相应 的 符号 表 。 

一 个 简单 的 实现 为 每 个 类 付 上 一 个 符号 表 ， 该 符号 表 带 有 两 个 修 套 层次 ， 一 个 是 各 方法 内 在 的 词法 
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作用 域 层 次 ， 另 一 个 是 每 个 类 的 继承 晨 次 。 因 为 一 个 类 可 以 充当 若干 子 类 的 超 类 ， 所 以 后 面 的 层次 比 简 
单 的 捆 表 图 更 复杂 。 然 而 ， 它 却 很 容易 管理 。 

当 编 译 类 C 中 的 一 个 方法 mr 时 ， 为 了 解析 一 个 名 字 fee， 编 译 器 首先 查阅 m 的 词法 作用 域 符号 表 。 如 果 
编译 器 在 这 一 表 中 没有 找到 fee， 那 么 它 搜寻 在 这 一 继承 层次 中 的 各 个 类 的 作用 域 ， 从 5 开始 沿 着 超 类 链 
向 上 搜索 。 如 果 这 一 查找 没有 找到 fee ， 那 么 搜索 将 在 全 局 符号 表 中 搜索 这 个 名 字 的 类 或 符号 表 。 全 局 
符号 表 必 须 包含 当前 组 件 以 及 导 和 组件 的 信息 。 

因此 ， 编 译 器 需要 每 一 个 方法 的 词法 作用 域 表 。 当 它 编译 这 一 方法 时 构建 这 一 词法 作用 域 表 。 编 译 
器 需要 每 一 个 类 的 符号 表 ， 这 一 符号 表 向 上 链接 继承 层次 。 它 需要 到 它 的 组 件 中 其 他 类 以 及 到 组 件 级 变 
量 的 符号 表 的 链接 。 它 需要 处 理 每 一 个 导入 类 的 符号 表 。 查 找 会 更 复杂 ， 因 为 查寻 必须 以 正确 的 顺序 跟 
踪 这 些 链 接 ， 而 且 只 检查 可 视 名 字 。 然 而 ， 实 现 和 处 理 这 些 表 所 需要 的 基本 机 制 已 经 为 人 们 所 熟知 。 


5.8 概括 和 展望 


中 间 表 示 的 选择 对 编译 器 的 设计 、 实 现 、 速 度 和 效率 产生 重要 的 影响 。 本 章 所 描述 的 中 间 表 示 没 有 
一 个 是 对 所 有 编译 器 或 对 给 定编 译 中 的 所 有 任务 来 说 是 权威 性 的 正确 答案 。 当 设计 者 选择 一 个 中 间 形 式 、 
设计 它 的 实现 、 增 加 诸如 符号 表 或 标签 表 等 辅助 数据 结构 时 ， 他 必须 全 面 考虑 编译 器 设计 的 整体 目标 。 

当代 编译 器 系统 使 用 形形色色 的 中 间 表 示 ， 范 围 从 分 析 树 、 抽 象 语法 树 (通常 被 用 于 源 程 序 到 源 
程序 系统 ) 直到 比 机 器 层次 还 低 的 线性 代码 (例如 用 于 Gnu 编 译 器 系统 )。 很 多 编译 器 使 用 多 个 IR， 它 
们 构建 第 二 个 、 第 三 个 IR 来 执行 特殊 的 分 析 或 转换 ， 然 而 再 修改 原来 的 I[R， 构 建 反映 分 析 、 转 换 结果 
的 最 终 IR。 


本 章 注释 


关于 中 间 表 示 及 其 使 用 经 验 的 文献 很 少 。 这 多 少 有 些 令 人 惊讶 ， 因 为 人 尽 对 编译 器 的 结构 和 行为 有 着 
非常 重要 的 影响 。 典 型 的 耻 形 式 已 在 很 多 教科 书 中 有 描述 [166，30，8，140]。 像 SSA 这 样 较 新 的 形式 
[104，267，47] 都 是 在 关于 分 析 和 优化 的 文献 中 描述 的 。Muchnick 给 出 这 一 课题 的 一 个 现代 的 处 理 方法 ， 
还 给 出 一 个 编译 器 中 IR 的 多 层次 使 用 的 展望 [262]。 . 

使 用 散 列 函数 来 从 文本 上 识别 文本 相同 操作 的 思想 要 追溯 到 Ershov[131]。 它 在 Lisp 体 系 中 的 特殊 应 
用 似乎 出 现 于 20 世 纪 70 年 代 初 [116，159]; 到 了 1980 年 ， 它 变 得 太 普通 以 致 McCarthy 没 有 引用 直接 提出 
了 这 一 方法 [252] 。 

Cai 和 Paige 把 多 重 集 鉴别 描述 成 散 列 法 的 一 种 替代 [58]。 他 们 的 目的 是 要 给 出 保障 常量 时 间 行 为 的 
高 效 查 找 机 制 。 关 于 减 小 R" 的 AST 的 工作 是 由 David Schwartz 和 Scott Warren 完 成 的 。 

实践 中 ，IR 的 设计 和 实现 对 完整 编译 器 的 最 终 特 征 有 非常 大 的 影响 。 大 而 且 复 杂 的 IR 似 乎 按 它 自己 
的 想像 来 构造 系统 的 形态 。 例 如 ， 用 于 20 世 纪 80 年 代 的 早期 的 程序 设计 环境 如 R" 等 中 的 大 型 AST 限 制 了 
能 够 分 析 的 程序 的 大 小 。 用 于 ILOC 中 的 RTL 形 式 有 低级 的 抽象 。 因 此, 编译 器 完成 管理 细节 的 精细 工作 ， 
诸如 在 代码 生成 中 所 需要 的 那些 细节 管理 工作 ， 但 是 它 很 少 考虑 那些 需要 源 代码 类 知识 的 转换 ， 诸 如 改 
进 内 存 层次 行为 的 循环 模块 化 等 等 。 


第 6 章 
过 程 抽象 





6.1 概述 


过 程 是 大 多 数 现代 程序 设计 语言 的 一 个 核心 抽象 。 过 程 创 建 一 个 可 控 的 执行 环境 。 每 一 个 过 程 都 有 
属于 它 自 己 的 命名 存储 单元 。 在 过 程 内 执行 的 语句 可 以 存 取 私有 存储 单元 内 的 私有 或 局 部 变量 。 过 程 在 
被 其 他 过 程 ( 或 操作 系统 ) 调用 时 执行 。 这 个 被 调用 的 过 程 ， 即 被 调用 者 ， 可 能 把 一 个 值 返回 到 它 的 调 
用 者 ,在 这 种 情况 下 这 个 过 程 被 称 为 函数 (function)。 过 程 间 的 这 样 的 接口 使 得 程序 员 得 以 独立 地 开发 
和 试 测 过 程 ; 过 程 之 间 的 这 种 独立 提供 了 应 付 其 他 过 程 中 的 问题 的 某 种 绝缘 层 。 

过 程 是 多 数 编译 器 基本 工作 单位 。 少 数 系统 要 求 一 次 为 编译 呈现 一 个 完整 的 程序 。 反 之 ， 编 译 器 可 
et th Bet ite ee E 

容易 。 想 像 一 下 在 没有 分 块 编译 的 情况 下 维护 一 个 一 百 万 行 的 程序 。 对 源 代码 的 任何 改动 都 将 需要 一 

完整 的 再 编译 ; 在 测试 一 个 单行 的 改动 之 前 ， 程 序 员 需 要 等 待 一 百 万 行 代码 的 编译 。 


关于 时 机 的 问题 


本 章 研究 编译 时 机 制 和 运行 时 机 制 。 编译 时 发 生 的 事件 和 运行 时 发 生 的 事件 之 间 的 差异 常会 引 | 
发 混淆 。 编 译 器 生成 所 有 在 运行 时 执行 的 代码 。 作 为 编译 过 程 的 一 部 分 ， 编 译 器 分 析 源 程序 并 构建 “| 


编码 分 析 结 果 的 数据 结构 来 对 分 析 结果 进行 编码 。( 回想 5.7.3 节 中 关于 词法 作用 域 符号 表 的 讨论 。) | 
编译 器 决定 程序 在 运行 时 使 用 的 大 部 分 内 存 布局 ;然后 ， 它 生成 创建 这 一 布局 、 在 执行 期 间 维护 这 | 
一 布局 以 及 存 取 数据 对 象 和 内 存 中 的 代码 所 需要 的 代码 。 当 被 编译 的 代码 运行 时 ， 它 存 取 数 据 对 象 | 
并 调用 过 程 或 方法 。 编 译 时 生成 所 有 代码 ; 执行 时 进行 所 有 的 存 取 。 





过 程 对 程序 员 开 发 软件 以 及 编译 器 翻译 程序 的 方式 起 着 重要 的 作用 。 过 程 提供 三 个 构建 复杂 程序 的 
重要 抽象 。 

(1) 控制 抽象 (control abstraction ) 

过 程 向 程序 员 提 供 简单 的 控制 抽象 ; 每 一 种 语言 都 有 一 个 调用 过 程 ， 并 把 一 组 变量 或 参数 从 调用 者 
的 名 字 空 间 映射 到 被 调用 者 的 名 字 空 间 的 标准 机 制 。 这 一 语言 的 标准 返回 机 制 允许 过 程 把 控制 返回 调用 
者 ， 在 调用 后 的 地 点 继续 执行 。 称 为 调用 序列 (calling sequence) 或 调用 约定 (calling convention) 的 
这 一 机 制 使 得 分 块 编译 成 为 可 能 ; 编译 器 可 以 生成 调用 任意 过 程 的 代码 ， 而 不 必 知 道 实现 这 一 被 调用 过 
程 的 代码 。 

(2) 名 字 空 间 (mame space) 

每 一 个 过 程 都 创建 一 个 新 的 受到 保护 的 名 字 空 间 ; 程序 员 可 以 声明 名 字 ， 诸 如 变量 或 标签 等 。 在 过 
程 的 内 部 ， 这 些 声明 取代 编译 器 已 看 到 的 相同 名 字 的 其 他 声明 。 在 过 程 的 内 部 ， 参 数 通过 它们 的 局 部 名 
字 引 用 ， 而 不 是 通过 它们 的 外 部 名 字 引 用 。 因 为 过 程 有 一 个 被 隔离 且 受 保护 的 名 字 空间 ， 当 被 不 同 的 上 
下 文 调用 时 ， 它 都 能 正确 地 运行 。 
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调用 过 程 实例 化 它 的 名 字 空 间 。 调 用 序列 保留 足够 的 空间 来 存放 在 这 个 过 程 的 名 字 空 间 中 声明 的 对 
象 。 这 一 空间 的 配置 既是 自动 的 又 是 高 效 的 ， 这 是 调用 这 个 过 程 的 结果 。 

(3) 外 部 接口 (external interface ) 

过 程 在 大 型 软件 系统 的 各 部 分 之 间 定 义 重 要 的 接口 。 名 字 作 用 域 、 可 寻 址 性 以 及 运行 时 环境 的 有 序 
保存 等 规则 创建 一 个 上 下 文 ， 在 这 一 上 下 文 内 程序 员 可 以 安全 地 调用 他 人 编写 的 代码 。 这 带 来 了 图 形 用 
户 界面 、 科 学 计算 以 及 系统 服务 等 的 程序 库 的 开发 和 使 用 。 系 统 使 用 相同 的 接口 开始 用 户 代码 的 执行 。 
在 建立 适当 的 运行 时 环境 之 后 ， 系 统 代码 调用 一 个 指定 的 人口 点 ， 例 如 main。 

在 很 多 方面 ， 过 程 是 构成 类 Algol 语 言 的 基本 程序 设计 抽象 。 在 操作 系统 的 协助 下 ， 过 程 与 编译 器 
和 硬件 环境 共同 创建 一 个 精美 的 外 表 。 过 程 创建 命名 变量 ， 并 把 它们 映射 到 虚拟 地 址 ; 操作 系统 把 虚拟 
地 址 映射 到 物理 地 址 。 过 程 建立 名 字 和 可 寻 址 性 的 可 视 规则 ; 硬件 通常 提供 若干 装 入 和 存储 的 形式 。 过 
程 使 我 们 能 够 把 大 型 软件 分 解 成 各 个 组 成 部 分 ; 链接 器 和 装 和 器 又 把 它们 编织 到 一 起 以 形成 一 个 可 执行 
程序 ， 硬件 通 过 递增 进程 序 计 数 器 和 跟踪 分 支 来 执行 这 一 程序 。 

编译 器 的 一 大 任务 是 配置 实现 过 程 抽象 的 各 个 部 分 所 需 的 代码 。 编 译 器 必须 规定 内 存 的 布局 并 在 生 
成 的 程序 中 对 那些 布局 进行 编码 。 因 为 编译 器 可 能 在 不 同 的 时 间 编 译 程序 的 不 同 组 成 部 分 ， 而 且 不 知道 
它们 与 其 他 组 成 部 分 的 关系 ， 因 此 这 种 内 存 布 局 及 其 引发 的 所 有 约定 都 必须 被 标准 化 并 统一 运用 。 编 译 
器 还 必须 使 用 操作 系统 提供 的 各 种 接口 ， 处 理 输入 和 输出 ， 管 理 内 存 并 与 其 他 进程 通信 。 

本 章 集中 讨论 作为 抽象 的 过 程 以 及 编译 器 用 于 建立 控制 抽象 、 名 字 空 间 及 与 外 部 世界 接口 的 机 制 。 


6.2 控制 抽象 


在 类 Algol 语 言 中 ， 过 程 有 一 整套 简明 的 调用 /返回 规则 。 在 一 个 过 程 的 出 口 ， 控 制 返 回 到 紧 跟 调 用 
者 调用 这 一 过 程 的 地 点 后 面 的 地 点 。 如 果 一 个 过 程 调 用 其 他 过 程 ,， 那么 这 些 过 程 以 相同 的 方式 返回 控制 。 
图 6-1 给 出 一 个 带 有 若干 嵌 套 过 程 的 Pascal 程 序 。 程 序 右 侧 的 调用 图 (call graph) 和 执行 历史 (execution 
history) 很 好 地 概括 这 一 Pascal 程 序 执行 时 所 发 生 的 一 切 。 

这 一 调用 图 给 出 各 过 程 间 可 能 的 一 组 调用 。 图 6-1 的 程序 可 以 调用 Fee 两 次 ; 第 一 次 是 Foe 中 的 调用 ， 
第 二 次 是 Fum 中 的 调用 。 事 实 上 ， 执 行 历史 给 出 这 一 程序 运行 时 上 述 所 发 生 的 一 切 。 每 一 次 对 Fee 的 调用 
都 创建 Fee 的 一 个 不 同 的 实例 ， 即 活动 (activation )。 在 Fum 被 调用 时 ，Fee 的 第 一 个 实例 不 再 是 活动 的 。 
它 由 Foe 中 (事件 3) 的 调用 生成 并 把 控制 返回 到 Foe (事件 4)。 在 Pascal 中 ， 没 有 允许 控制 返回 到 Fee 的 
这 一 活动 的 机 制 ; 一 旦 控制 返回 (事件 4)， 那 么 这 一 活动 就 终止 。 因 此 ， 当 Fum 调 用 Fee 时 (事件 6)， 它 
创建 Fee 的 一 个 新 的 活动 。 在 控制 返回 到 Fum (事件 7) 之 后 ， 这 第 二 个 活动 终止 。 

当 程 序 执行 Fee 的 第 一 个 调用 中 的 赋值 x:=1 时 ， 活 动 着 的 过 程 是 Fee 、Foe 、Fie 和 Main。 所 有 这 些 
活动 着 的 过 程 都 位 于 调用 图 中 从 Main 到 Fee 的 一 条 路 径 上 。 同 样 地 ， 当 程序 执行 Fee 的 第 二 个 调用 时 ， 活 
动 着 的 过 程 (Fee、Fum、Foe、Fie 和 Main) 都 位 于 从 Main 到 Fee 的 一 条 路 径 上 。 在 执行 期 间 的 任意 点 ， 
这 些 过 程 活动 构成 调用 图 中 的 某 个 有 根 路 径 。Pascal 的 调用 和 返回 机 制 保证 这 一 点 。 

当 编 译 器 实现 调用 和 返回 时 ， 它 必须 设法 保存 调用 和 返回 正确 操作 所 需 的 足够 多 的 信息 。 因 此 ， 当 
Foe 调 用 Fum 时 ， 调 用 机 制 必 须 保存 控制 返回 到 Foe 时 所 需 的 信息 。 由 于 某 个 运行 时 错误 、 一 个 无 限 循 环 
或 是 对 某 个 不 返回 过 程 的 子 调 用 ，Fum 可 能 发 散 或 不 返回 。 另 外 ， 调 用 机 制 必 须 保 存 当 Fum 返 回 时 恢复 在 
foe 中 的 执行 所 需 的 足够 多 的 信息 。 

这 一 简单 的 调用 和 返回 行为 可 以 用 栈 来 模型 化 。 当 Fie 调 用 Foe 时 ， 它 把 一 个 返回 地 址 压 人 栈 。 妆 
foe 返 回 时 ， 它 将 这 一 地 址 从 栈 中 弹出 ， 并 跳 转 到 那个 地 址 。 如 果 所 有 过 程 都 满足 这 一 规则 ， 那 么 从 栈 
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中 弹出 返回 地 址 将 暴露 出 下 一 个 适当 的 返回 地 址 。 

栈 机 制 也 可 以 很 好 地 处 理 递 归 。 事 实 上 ， 这 一 调用 机 制 打开 穿 过 调用 图 中 的 环 路 ， 并 为 过 程 的 每 一 
个 调用 创建 一 个 不 同 的 活动 。 只 要 递归 终止 ， 这 一 路 径 将 是 有 限 的 ， 而 且 返 回 地 址 的 栈 将 正确 地 捕获 这 
一 程序 的 行为 。 i 


program Main(input, output); 
var x,y,z: integer; 
procedure Fee; 
var x: integer; 
begin { Fee } 


x := 1; 
yse x* 241 
end; 


procedure Fie; 
var y: real; 
procedure Foe; 
var z: real; 
procedure Fum; 
var y: real; 
begin { Fum } 
x := 1.25 * z; 
Fee; 
writeln('x = ',x) 
end; 
begin { Foe } 
z := 1; 
Fee; 
Fum 
end; 
begin { Fie } 
Foe; 
writein('x = ',x) 
end; 
begin { Main } 
x := 0; 
Fie 
end. 执行 历史 


. Main calls Fie 

. Fie calls Foe 

. Foe calls Fee 

Fee returns to Foe 
Foe calls Fum 

Fum calls Fee 

Fee returns to Fum 
Fum returns to Foe 
Foe returns to Fie 

. Fie returns to Main 


ER 


m= 





图 6-1 非 递归 Pascal 程 序 


为 使 这 一 描述 更 具体 ， 考 虑 如 图 6-2 所 示 的 阶乘 的 递归 计算 。 当 调用 到 计算 (fact 5) 时 ， 这 一 递归 
计算 生成 一 系列 递归 调用 : (fact 5) 调用 (fact 4) 调用 (fact 3) 调用 (fact 2) 调用 (fact 1). 
在 这 一 点 ，cond 语 句 执行 分 名 《<= k 1), 终止 递归。 这 一 递归 以 相反 的 顺序 展开 ，(fact 1) 的 
调用 把 值 1 返 回 到 (fact 2)。 它 又 把 值 2 返回 到 (fact 3), 而 
(fact 3) 把 值 6 返回 到 (fact 4)。 最 后 ，(fact 4) 把 值 24 返 | (ering (fact K) 
回 到 (fact 5), (fact 5) 通过 24 乘 以 5 返回 答案 120。 这 一 递 [(<= k 1) 1] 
归程 序 展示 了 后 进 先 出 的 行为 方式 ， 所 以 栈 机 制 正确 地 跟踪 所 有 yfetse ( (fact (subl 9) 19] 
的 返回 地 址 。 . 
更 复杂 的 控制 流 图 6-2 Scheme 中 的 阶乘 的 递归 程序 
有 些 程序 设计 语言 ， 例 如 Scheme， 人 允许 过 程 返回 到 过 程 及 它 的 运行 时 上 下 文 〈 通 常 称 为 闭 包 
(closure) )。 当 这 一 闭 包 被 调用 时 ， 这 一 过 程 在 它 被 返回 的 运行 时 上 下 文中 执行 。 简 单 的 栈 不 足以 实现 
这 一 控制 抽象 。 控 制 信息 必须 保存 在 诸如 链表 这 样 的 更 一 般 的 结构 中 ， 在 那里 ， 返 回 并 不 意味 着 解除 内 
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存单 元 分 配 (参见 6.3.2)。 如 果 这 一 语言 允许 引用 生存 期 超过 过 程 的 活动 期 的 局 部 变量 ， 那 么 也 会 引发 
类 似 的 问题 。 


6.3 ”名字 空间 


在 大 多 数 过 程 语言 中 ， 一 个 完整 程序 将 包含 多 个 名 字 空 间 。 称 为 作用 域 (scope) 的 每 一 个 名 字 空 
间 把 一 组 名 字 映 射 到 一 组 值 上 ， 并 把 过 程 映射 到 程序 中 的 一 组 语句 上 。 作 用 域 可 以 是 整个 程序 、 过 程 的 
某 个 集合 单一 过 程 或 者 是 一 小 组 语句 。 在 一 个 作用 域内 ， 程 序 员 可 以 创建 在 这 个 作用 域 的 外 面 不 可 存 
取 的 名 字 。 这 个 作用 域 可 从 其 他 作用 域 继承 某 些 名 字 。 在 一 个 作用 域内 创建 一 个 名 字 fee 可 能 会 隐藏 fee 
在 周围 作用 域 中 的 定义 ， 事 实 上 ， 这 样 做 会 使 它们 在 这 个 作用 域内 不 可 存 取 。 总 之 ， 作 用 域 规则 使 得 程 
序 员 可 以 控制 程序 存 取信 息 的 方式 。 


6.3.1 类 Algol 语 言 的 名 字 空 间 


大 多 数 传统 的 程序 设计 语言 继承 为 Algol 60 所 定义 的 很 多 约定 和 规则 。 控 制 名 字 可 见 性 的 规则 尤 
其 如 此 。 本 节 给 出 在 类 Algol 语 言 中 有 效 的 命名 表 记 法 ， 并 特别 强调 运用 于 这 种 语言 中 的 层次 作用 域 
规则 。 

1. REDEEM 

大 多 数 类 Algol 语 言 允 许 程序 员 把 一 个 作用 域 嵌 套 在 另外 一 个 作用 域内 。 大 多 数 面 向 对 象 语言 把 词 
法 作用 域 作 为 名 字 分 解 的 一 个 机 制 ; 例如 ， 由 一 个 方法 所 定义 的 作用 域 通 常 存在 于 包含 这 一 方法 的 类 的 
作用 域内 。 任 意 超 类 的 作用 域 由 套 在 这 个 类 的 外 面 。 对 象 的 实例 变量 存在 于 这 一 类 的 作用 域内 。 在 过 程 
语言 中 ， 当 块 互相 风 套 时 就 会 产生 作用 域 ， 就 像 在 C 或 Ct+ 中 那样 。 或 者 当 过 程 互相 婴 大 ,时 就 会 产生 作 
用 域 ， 就 像 在 Pascal 中 那样 。 

Pascal 使 娱 套 过 程 广 为 流传 。 每 一 个 过 程 定义 一 个 新 的 作用 域 ， 而 且 程 序 员 可 以 在 每 一 个 作用 域内 


声明 新 变量 和 过 程 。Pascal 使 用 最 普通 的 称 为 词法 作用 域 (lexical scoping) 的 作用 域 规 则 。 词 法 作用 域 


的 一 般 规则 很 简单 
在 给 定 作用 域内 ， 每 个 名 字 引 用 它 在 词法 上 最 近 的 声明 。 


因此 ， 如 果 s 用 于 当前 的 作用 域内 ， 那 么 如 果 在 当前 作用 域内 有 s 的 声明 则 它 将 引用 这 个 s。 如 果 不 存 
在 这 样 的 声明 ， 那 么 它 将 引用 出 现在 最 近 的 外 围 嵌 套 的 作用 域 中 的 * 的 声明 。 最 外 面 的 作用 域 包含 全 
局 变量 。 

为 了 使 词法 作用 域 更 具体 ， 考 虑 图 6-3 中 给 出 的 Pascal 程 序 。 这 一 程序 包含 五 个 不 同 的 作用 域 ， 一 
对 应 于 程序 Main ， 另 外 四 个 分 别 对 应 于 过 程 Fee、Fie、Foe 和 Fum。 每 一 个 过 程 声明 名 字 x、y 和 z 的 某 个 
”变量 子 集 。 图 6-3 给 出 的 每 个 名 字 带 有 表示 其 层次 数字 的 下 标 。 在 一 个 过 程 中 声明 的 名 字 总 是 有 一 个 比 
这 个 过 程 的 名 字 层 大 1 的 层次 。 因 此 ， 如 果 如 图 所 示 Main 是 层次 0， 直接 在 Main 内 定义 声明 的 名 字 如 xX、y、 
z、Fee 和 Fie 都 是 层次 1。 

为 了 表示 词法 作用 域 化 语言 中 的 名 字 ， 编 译 器 可 以 对 每 一 个 名 字 使 用 静态 坐标 (static coordinate). 
静态 坐标 是 一 个 序 对 <!，o> ， 其 中 是 符号 表 中 的 词法 嵌 套 层次 ， 而 o 是 它 在 这 个 作用 域 的 数据 区 的 内 存 
位 置 的 偏 称 量 。 为 了 得 到 1!， 编 译 器 前 端 使 用 词法 作用 域 符号 表 ， 如 5.7.3 节 所 述 。 偏 移 量 o 应 该 连同 这 一 
名 字 及 它 在 符号 表 中 的 层次 一 起 存储 。 (可 以 在 上 下 文 相关 分 析 过 程 中 处 理 声 明 时 指定 偏 移 量 。 ) 图 6-3 
右边 的 表 给 出 每 一 过 程 中 的 每 一 变量 名 的 静态 坐标 。 
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program Maing(input, output); 
var X1,¥3.Z1: integer; 
procedure Feesubr 1° 
var x2: integer; 
begin { Fee } 






procedure Fie); 
var yo: real; 
procedure Foez; 
var z3: real; (Fee) Fie) 
procedure Fums 
var y4: real; 
begin { Fum } Foe) 
Xy := 1.25 * Z3; 















Fee,; 
writein('x = ',x1) (un) 
end; 
begin { Foe } REXA 
z3 := 1; 
Fee; 
Fuma 


end; 


begin { Fie } 

Foe2; (Main) 
writeln('x = ',x%1) 

end; (Fie) 


begin { Main } (Fee) 


xı := 03 7 
Fie (Foe) 
end. . 


图 6-3 Pascal FAY Be inde HE FS 


ERBERMARRAF RENE — Mor. SAP aL? 须 使 用 静态 坐标 对 运行 时 的 这 个 值 进行 定 位 。 


给 定 一 个 坐标 <!，o>， 代 码 生 成 器 必须 发 行将 /翻译 成 适当 数据 区 域 的 运行 时 地 址 的 代码 。 然 后 ， 编译 器 


使 用 篇 移 量 o 计 算 对 应 于 <!，o> 的 变量 的 地 址 。6.5.2 节 将 给 出 完成 这 一 任务 的 两 个 不 同 的 方法 。 

2. 各 种 语言 中 的 作用 域 规则 

程序 设计 语言 有 很 多 不 同 的 作用 域 规则 。 编 译 器 设计 者 必须 理解 源 语言 的 这 些 特 定 规则 ， 而 且 必 须 
改编 一 般 的 翻译 方案 以 适用 于 这 些 特定 规则 。 图 6-4 描 述 几 种 语言 的 名 字 作用 域 规则 。 

最 古老 的 FORTRAN 语 言 创建 两 种 作用 域 : 保 在 过程 名 字 和 公用 块 名 字 的 全 局 作用 域 和 一 系列 局 部 
作用 域 ， 每 个 局 部 作用 域 对 应 于 一 个 过 程 。 一 个 公用 块 是 由 一 个 名 字 和 一 个 变量 列表 组 成 的 ; 这 些 公用 
块 的 元 素 只 是 全 局 变量 。(FORTRAN 人 允许 在 不 同 的 文件 中 对 一 个 公用 块 做 不 同 的 描述 。 这 迫使 编译 器 把 
公用 块 引用 翻译 成 距离 这 个 公用 块 开 始 位 置 的 偏 移 量 ， 从 而 保证 处 理 的 一 致 性 ) 在 一 个 过 程 内 部 ， 程 
序 员 可 以 声明 局 部 变量 。 如 果 局 部 名 字 与 公用 块 元 素 名 字 发 生 冲 突 ， 局 部 名 字 覆 盖 公 用 块 元 素 名 字 。 在 
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默认 情况 下 ， 一 个 过 程 的 局 部 变量 有 与 这 个 过 程 的 调用 相 匹 配 的 生存 期 。 通 过 在 save 语 句 中 提 及 过 程 局 
部 变量 ， 程 序 员 可 以 迫使 这 个 过 程 的 局 部 变量 有 与 这 一 程序 的 生存 期 相 匹配 的 生存 期 。 这 使 得 这 个 局 部 
变量 成 为 一 个 静态 (static) 变量 ， 在 对 这 一 过 程 的 不 同调 用 之 间 它 的 值 被 保留 下 来 。 所 有 全 局 变量 都 是 
静态 的 ， 它 们 的 值 总 是 被 保留 着 。 


FORTRAN 77 名 字 空 间 。 C 名 字 空 间 


fee 


variables variables 


parameters 
labels 

(both saved 
& unsaved) 


:| parameters |: 
:| labels 
‘|| variables ||: 
: ||_/abels ... 





Schema 名 字 空 间 Java 名 字 空 间 
全 局 作用 域 。 


i| fields: cow, goose m 
:| method: exclaim |:: 
:| local variables 

i| method: sme11 

:| local variables 


class beans 
i| fields: size 
:| method: grow 





图 6-4 几 种 语言 中 的 名 字 空 间 


C 语 言 有 更 复杂 的 规则 。 它 创建 一 个 全 局 作用 域 来 保存 所 有 过 程 名 字 以 及 所 有 全 局 变量 的 名 字 。 每 
一 个 过 程 有 它 自己 的 变量 、 参 数 和 标签 的 局 部 作用 域 。 过 程 不 能 寿 套 在 另 一 个 过 程 内 (而 Pascal 中 可 以 
相互 幅 套 )， 但 是 一 个 过 程 可 以 包含 一 个 创建 独立 局 部 作用 域 的 块 ( 块 是 由 左 大 括号 和 右 大 括号 包围 的 
区 域 )。 块 可 以 做 套 。 程序 员 通 常 使 用 块 级 作用 域 为 预 处 理 器 的 宏 所 生成 的 代码 创建 临时 存储 或 创建 一 
hl 

语言 引入 另外 一 个 作用 域 级 别 ， 即 文件 范围 作用 域 ， 这 一 作用 域 包含 单一 文件 (或 编译 单位 ) 中 
BAE, CABIR A E EENA ERDERAS CARAM MATIEM 冯 
些 名 字 将 是 全 局 变量 。 这些 名 字 对 文件 中 的 所 有 过 程 都 是 可 视 的 ,而 对 这 一 文件 外 的 过 程 则 是 不 可 视 的 。 
变量 和 过 程 都 可 声明 为 静态 的 。 | 


| 动态 作用 域 | 
除 词法 作用 域外 ， 还 有 一 种 称 为 动态 作用 域 的 作用 域 。 词 法 作用 域 与 动态 作用 域 之 间 的 差异 仅 | 


| 在 于 一 个 过 程 引 用 在 其 自身 的 作用 域外 部 声明 的 变量 时 的 行为 不 同 ， 有 时 称 这 样 的 变量 为 自由 变量 | 


| (free variable). 
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对 于 词法 作用 域 ， 作用 域 规则 简单 且 具有 一 臻 性: 自由 变量 被 缚 定 到 词法 上 最 接近 这 一 所 用 名 
字 的 声明 。 也 就 是 说 ， 如 果 编 译 器 从 包含 这 一 使 用 的 作用 域 开始 检查 相继 的 周围 作用 域 ， 那 么 这 一 | 
变量 就 被 绑 定 到 编译 器 发 现 的 第 一 个 声明 上 。 这 一 声明 总 是 来 自 于 包围 这 一 引用 的 作用 域 。 
对 于 动态 作用 域 ， 规 则 也 同样 简单 : 自由 变量 被 绑 定 到 运行 时 由 该 名 字 最 新 创建 的 变量 上 . 因 | 
此 ， 当 执行 遇 到 一 个 自由 变量 时 ， 它 就 把 这 一 自由 变量 绑 定 到 这 一 名 字 最 后 创建 的 实例 上 。 早 期 的 


实现 创建 一 个 名 字 栈 ， 每 一 个 已 创建 的 名 字 被 压 入 到 这 一 栈 上 。 为 了 绑 定 一 个 自由 变量 ， 运 行 时 系 


统 自 顶 向 下 搜索 这 个 名 字 栈 ， 直 到 找到 一 个 带 有 该 名 字 的 变量 为 止 。 后 期 的 实现 更 加 高 效 。 | 

尽管 很 多 早期 的 Lisp 系 统 使 用 了 动态 作用 域 ， 但 是 词法 作用 域 已 成 为 人 们 选择 的 技术 。 动 态 作 | 
用 域 很 容易 在 解释 器 中 实现 ， 但 在 某 种 程度 上 很 难 在 编译 器 中 高 效 地 实现 。 它 可 能 产生 很 难 找到 又 | 
很 难 理解 的 错误 。 动 态 作用 域 仍 然 出 现在 某 些 语言 中 ; 例如，Common Lisp 仍 然 允 许 程序 员 强 制 变 | 
量 遵循 动态 作用 域 规则 。 | 





Scheme 有 一 组 简单 的 作用 域 规 则 。Scheme 中 的 几乎 所 有 对 象 都 在 一 个 全 局 空间 内 。 对 象 可 以 是 数 
据 或 是 可 执行 表达 式 。 系 统 提供 的 函数 ， 如 cons ， 同 用 户 编写 的 代码 和 数据 项 共存 。 由 可 执行 表达 式 组 
成 的 代码 可 以 通过 使 用 1et 表 达 式 创建 私有 对 象 。 嵌 套 的 1et 可 以 创建 任意 深度 的 藤 套 词法 作用 域 。 

Java 有 一 个 限定 的 全 局 名 字 空 间 ; 只 有 那些 被 声明 为 “公有 (public)” 的 类 是 全 局 的 名 字 。 每 一 个 
类 居于 一 个 组 件 中 。 一 个 组 件 可 以 包含 多 个 类 。 一 个 类 既 可 包含 域 (数据 项 ) 又 可 包含 方法 (代码 )。 
公有 类 中 的 域 和 方法 可 以 被 声明 成 公有 成 员 ; 这 使 得 这 些 成 员 可 被 其 他 组 件 中 的 类 的 方法 存 取 或 调用 。 
类 中 的 域 和 方法 可 被 相同 组 件 中 的 所 有 类 中 的 方法 存 取 和 调用 ， 除 非 这 一 域 或 方法 被 明确 地 声明 为 “ 私 
有 的 (private)”。 类 可 以 嵌 套 在 另外 一 个 类 中 。 

如 果 Java 类 giant 声明 一 个 域 cow， 这 个 声明 在 每 一 个 giant 的 实例 中 都 创建 一 个 域 cow。 当 程序 创建 
新 的 giant 时 ， 每 一 个 giant 都 有 它 自 己 的 cow。 类 giant 也 可 能 需要 某 些 公有 域 ， 这 样 的 域 对 于 整个 类 
只 有 一 个 实例 。 为 了 声明 这 些 类 变量 (class variable)， 程 序 员 要 声明 一 个 静态 (static) M. © 


6.3.2 活动 记录 


一 个 新 的 独立 名 字 空 间 的 创建 是 过 程 抽 象 的 一 个 重要 部 分 。 在 一 个 过 程 内 部 ， 程 序 员 可 以 声明 在 这 
一 过 程 外 不 可 存 取 的 命名 变量 。 这 些 命名 变量 可 以 被 初始 化 到 一 个 已 知 值 。 在 类 Algol 语 言 中 ， 局 部 变 
量 有 与 声明 它们 的 过 程 相 匹配 的 生存 期 。 因 此 ， 在 这 一 调用 的 生存 期 间 这 些 局 部 变量 需要 存储 ， 而 且 它 
们 的 值 只 有 当 这 一 创建 它们 的 调用 是 活动 的 时 候 才 有 意义 。 如 果 一 个 过 程 的 多 个 调用 在 同一 时 间 内 都 是 
活动 的 ， 那 么 每 一 个 调用 都 需要 这 些 局 部 变量 自身 的 私有 拷贝 。 

为 了 适用 这 一 行为 ， 编 译 器 设法 给 一 个 过 程 的 每 一 次 活动 留 出 一 个 内 存 区 域 。 我 们 称 这 个 块 为 活动 
记录 (activation record，AR)。 在 大 多 数 环 境 下 ， 当 某 一 个 过 程 调用 gq 时 在 运行 时 创建 9 的 AR， 而 且 当 
控制 从 4 返回 时 AR 被 释放 。9 的 这 个 AR 包含 4 的 局 部 变量 所 需要 的 所 有 存储 以 及 维护 4 的 状态 所 需要 的 所 
有 其 他 数据 。 这 一 AR 通常 还 保存 这 个 过 程 的 这 一 次 调用 的 返回 地 址 。 更 方便 的 是 这 一 状态 信息 的 生存 
期 与 局 部 变量 的 生存 期 相同 。 

4 的 这 个 AR 把 4 的 运行 代码 与 这 一 程序 的 其 他 部 分 连结 起 来 。 当 P 调 用 4 时， 实现 这 一 调用 的 代码 序 
列 必 须 既 保存 p 的 环境 又 为 4 创建 一 个 新 环境 。 因 此 ， 这 一 运行 代码 为 4 创建 一 个 AR 并 把 4 的 执行 所 需 的 


O Static 这 一 词 的 使 用 也 许 显 得 奇怪 ， 除 非 你 考虑 到 这 样 事实 ; 一 个 类 变量 从 一 个 类 被 装 入 直到 执行 停止 的 时 
间 内 生存 。 因 此 ， 静 态 变量 从 它 第 一 次 被 提 及 直到 执行 的 结束 都 保留 它 的 值 。 
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信息 以 及 为 重 构 p 的 环境 而 执行 的 返回 序列 所 需要 的 信息 存储 在 这 个 AR 中 。( 其 中 的 某 些 信 息 被 直接 播 
入 到 p 和 gq 的 代码 中 。) 图 6-5 展 示 如 何 布局 AR 的 内 容 。 整 个 AR 通过 一 个 活动 记录 指针 (activation record 
pointer, ARP) 来 寻 址 ， 各 域 位 于 距离 ARP 的 正 或 负 的 偏 移 处 。 262 


局 部 数据 区 域 
局 部 数据 区 域 
可 寻 址 性 
区 






















可 寻 址 
寄存 器 存储 区 域 


调用 者 的 AR 


寄存 器 存储 区 域 


被 调用 者 的 AR 
图 6-5 典型 的 活动 记录 


参数 区 域 保存 从 调用 者 到 被 调用 者 之 间 传 输 的 参数 。 寄 存 器 保存 区 域 保存 被 调用 者 在 调用 序列 中 必 
须 保 存 的 值 。 如 果 需 要 的 话 ， 返 回 值 档 保 存 用 于 从 被 调用 者 返回 到 调用 者 的 通信 数据 ， 而 返回 地 址 槽 保 
存 当 被 调用 者 终止 时 执行 应 该 恢复 的 运行 时 地 址 。 让 被 调用 者 存 取 它 周 围 词 法 作用 域 (不 一 定 是 调用 者 ) 
内 的 变量 的 机 制 可 以 使 用 标签 为 “可 寻 址 性 ”的 槽 。 被 调用 者 的 ARP 槽 保存 调用 者 的 ARP， 当 被 调用 者 
终止 时 需要 恢复 它 的 环境 。 最 后 ， 局 部 数据 区 域 保存 被 调用 者 的 局 部 变量 。 出 于 高 效 性 ， 这 一 AR 的 某 
些 部 分 也 许 被 存放 于 专用 寄存 器 。 l 


1. 局 部 存储 1 

一 个 过 程 的 AR 保存 它 的 局 部 数据 和 状态 信息 。 这 个 过 程 的 每 一 次 调用 都 需要 一 个 独立 的 AR。 对 一 
个 过 程 的 AR 的 所 有 存 取 都 把 这 一 过 程 的 ARP 作 为 出 发 点 。 因 为 过 程 经 常 存 取 它 们 的 ARP， 所 以 大 多 数 
编译 器 专门 开辟 一 个 硬件 寄存 器 来 保存 当前 过 程 的 ARP。 在 ILOC 中 ， 我 们 把 这 一 专用 寄存 器 称 为 rp。 26 

ARP 指 向 这 个 AR 中 的 一 个 指定 位 置 。 这 个 AR 的 中 心 部 分 有 一 个 静态 布局 ， 所 有 的 域 都 有 已 知 的 固 
定 长 度 。 这 保证 代码 可 以 通过 距离 这 个 ARP 的 固定 偏 移 量 来 存 取 那 些 项 。AR 的 尾部 被 保留 下 来 ， 作 为 
其 大 小 在 每 一 次 调用 可 能 发 生变 化 的 存储 区 域 。AR 的 一 端 通常 保存 参数 存储 区 域 ， 而 另外 一 端 保存 局 
部 数据 区 域 。 

(1) 为 局 部 数据 保留 的 空间 

每 一 个 局 部 数据 项 都 可 能 需要 AR 内 的 空间 。 编 译 器 为 每 一 个 这 样 的 项 指定 一 个 适当 大 小 的 区 域 ， 
并 记录 当前 的 词法 级 和 它 在 符号 表 中 距离 ARP 的 偏 移 量 。 词 法 级 和 偏 移 量 这 一 序 对 成 为 此 局 部 数据 项 的 
静态 坐标 。 于 是 ， 使 用 类 似 于 10adA0 的 操作 ， 并 以 reo 和 这 个 偏 移 量 作为 这 个 操作 的 参数 ， 我 们 可 以 对 
局 部 变量 提供 高 效 的 存 取 。 

对 于 某 些 局 部 变量 ,编译 器 在 编译 时 不 知道 它们 的 大 小 。 程 序 可 能 从 外 部 设备 读 取 一 个 数组 的 大 小 ， 
或 根据 在 计算 的 前 期 阶段 所 做 的 工作 来 决定 数组 的 大 小 上 。 对 于 这 样 的 变量 ， 编 译 器 可 以 在 局 部 数据 区 

日 例如 ， 编 译 器 的 后 面 的 遍 可 以 经 常 使 用 更 简单 的 数据 结构 ， 因 为 这 些 遍 可 以 决定 被 编译 代码 的 大 小 。 前 端 


必须 有 可 适度 扩展 的 数据 结构 。 前 端 可 以 为 这 些 结构 记录 适当 的 尺度 ， 使 得 优化 器 和 后 端 可 以 分 配给 这 些 
结构 以 适当 的 大 小 。 : f . 
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域内 为 一 个 指向 实际 数据 或 指向 一 个 数组 的 描述 器 的 指针 留 出 空间 (参见 7.5.3 节 )。 于 是 ， 编 译 器 在 运 
行 时 在 其 他 地 方 分 配 实际 的 存储 空间 。 在 这 样 的 情况 下 ， 静 态 坐 标 给 编译 器 指出 指针 的 位 置 ， 而 实际 存 
取 或 者 直接 使 用 这 一 指针 或 者 使 用 这 一 指针 计算 在 可 变 长 度数 据 区 域内 的 适当 地 址 。 

(2) 初始 化 变量 

如 果 源 语言 允许 程序 给 变量 指定 初始 值 ， 那 么 编译 器 必须 设法 使 这 个 初始 值 出 现 。 如 果 这 个 变量 是 
被 静态 地 分 配 的 ， 也 就 是 说 ， 这 一 变量 有 独立 于 任意 过 程 的 生存 期 ， 而 且 这 个 初始 值 是 在 编译 时 已 知 的 ， 
那么 通过 装 人 器 这 一 数据 可 以 被 直接 插入 到 适当 的 位 置 。( 静 态 变量 通常 被 存储 于 所 有 AR 的 外 面 。 这 样 
的 变量 拥有 一 个 实例 ， 即 跨越 所 有 调用 保存 单一 值 ， 为 我 们 提供 了 必要 的 语义 。 使 用 独立 的 静态 数据 区 
域 ， 或 者 一 个 过 程 对 应 一 个 静态 数据 区 域 ， 或 者 整个 程序 对 应 一 个 静态 数据 区 域 ， 编 译 器 可 以 使 用 一 般 
在 装 和 人 器 中 看 到 的 初始 化 特性 。 ) 

另 一 方面 ， 局 部 变量 必须 在 运行 时 初始 化 。 因 为 一 个 过 程 可 以 被 调用 多 次 ， 设 置 初始 值 的 惟一 可 行 
方法 是 生成 把 必要 值 存储 到 适当 位 置 的 指令 。 作 为 结论 ， 这 些 初 始 化 是 在 每 一 次 被 调用 时 执行 这 一 过 程 
的 第 一 个 语句 之 前 的 赋值 。 

(3) 保存 寄存 器 值 的 空间 

当 p 调 用 4 时 ， 它 们 中 的 一 个 必须 保存 p 所 需 的 寄存 器 值 。 也 许 需要 保存 所 有 寄存 器 的 值 ， 另 一 方面 ， 
也 许 一 个 子 集合 就 足够 了 。 在 返回 到 p 时 ， 必 须 恢复 这 些 被 保存 的 值 。 因 为 p 的 每 一 次 活动 存储 一 组 不 同 
的 值 ， 保 存 寄存 器 值 的 空间 是 设置 在 AR 内 的 。 如 果 被 调用 者 保存 寄存 器 ， 那 么 寄存 器 的 值 被 存储 在 被 
调用 者 的 寄存 器 存储 区 域 。 同 样 地 ， 如 果 调 用 者 保存 寄存 器 ， 那 么 这 个 寄存 器 的 值 被 存储 在 调用 者 的 寄 
存 器 存储 区 域 。 对 于 一 个 调用 者 p， 在 p 的 内 部 一 次 只 能 有 一 个 调用 是 活动 的 。 因 此 ， 在 pz 的 AR 内 的 单一 
寄存 器 存储 区 域 足够 用 于 p 所 能 做 出 的 所 有 调用 。 

2. 分 配 活动 记录 

作为 执行 从 p 到 4 的 调用 的 一 部 分 ， 执 行 代码 必须 为 4 分 配 一 个 AR， 并 保证 AR 中 的 各 个 域 都 被 填充 
适当 的 值 。 如 果 如 图 6-5 所 示 的 所 有 域 都 的 确 存 储 在 内 存 中 ， 那 么 这 个 AR 必 须 对 调用 者 p 是 可 用 的 ， 这 
样 p 可 以 存储 实 参 、 返 回 地 址 、 调 用 者 的 ARP 和 可 寻 址 性 信息 。 这 人 迫使 把 4 的 AR 分 配 植 于 p 中 ， 而 在 p 中 
这 个 AR 的 局 部 数据 区 域 的 大 小 可 能 是 未 知 的 。 另 一 方面 ， 如 果 这 些 值 都 是 在 寄存 器 中 传递 的 ， 那 么 这 
个 AR 的 实际 分 配 可 以 在 被 调用 者 4 内 完成 。 这 使 得 4 负责 分 配 这 个 AR， 包 括 局 部 数据 区 域 所 需要 的 所 有 
空间 。 分 配 后 ， 它 可 能 把 用 寄存 器 传递 的 某 些 值 存储 到 它 的 AR 中 。 

”编译 器 设计 者 对 于 分 配 活动 记录 有 若干 选择 。 选 择 既 影响 过 程 调 用 的 代价 也 影响 高 级 语言 特性 ， 诸 
如 构建 闭 包 等 的 实现 代价 。 选 择 还 影响 活动 记录 所 需 的 内 存 总 量 。 

(1) 活动 记录 的 栈 分 配 1 

在 多 数 情况 下 ， 当 一 个 过 程 的 活动 引发 AR 的 创建 时 ， 这 一 AR 的 内 容 只 有 在 这 一 过 程 的 生存 期 才 有 
意义 。 简 而 言 之 ， 大 多 数 变 量 不 能 比 创建 它们 的 过 程 的 生存 期 长 ， 而 且 大 多 数 过 程 活动 不 能 比 它们 的 调 
用 者 的 生存 期 长 。 这 诸多 的 限制 使 调用 和 返回 达到 平衡 ; 它们 遵循 后 进 先 出 (last-in first-out, LIFO) 
的 规则 。 一 个 从 p 到 4 的 调用 最 终 要 返回 ， 而 且 在 p 到 4 的 调用 和 4 到 p 的 返回 之 间 出 现 的 任意 返回 必须 是 由 
g (或 者 直接 或 者 间接 ) 所 做 的 调用 的 结果 。 在 这 种 情况 下 ， 活 动 记录 也 遵循 LIFO 顺 序 ; 因此 ， 可 以 把 
这 些 活 动 记录 分 配 到 一 个 酰 上 。Pascal、c、Java 通 常 都 是 由 栈 分 配 AR 实 现 的 。 

在 栈 上 保存 活动 记录 有 几 个 优点 。 分 配 和 释放 的 代价 都 不 高 ; 每 一 个 操作 需要 一 个 作用 于 标明 栈 顶 
的 值 上 的 算术 操作 。 调 用 者 可 以 开始 设置 被 调用 者 的 AR 的 过 程 。 它 可 以 分 配 局 部 数据 区 域 之 前 的 所 有 
空间 。 然 后 ， 被 调用 者 可 以 通过 增加 酚 顶 (top-of-stack, TOS) 指针 扩展 AR 来 包含 局 部 数据 区 域 。 被 
调用 者 可 以 使 用 相同 的 机 制 来 逐步 扩展 当前 AR 以 保存 可 变 大 小 的 对 象 ， 如 图 6-6 所 示 。 这 里 ， 被 调用 者 
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把 TOS 指 针 拷贝 到 4 的 局 部 数据 区 域 槽 ， 然 后 通过 4 的 大 小 增加 TOS 指 针 。 最 后 ， 使 用 栈 分 配 AR ， 调 试 
器 可 以 从 栈 顶 到 栈 底 遍 历 该 栈 以 产生 当前 活着 的 过 程 的 快照 。 

(2) 活动 记录 的 堆 式 分 配 

如 果 一 个 过 程 的 生存 期 可 以 比 它 的 调用 者 长 ， 那 么 分 配 AR 的 
栈 规则 就 不 成 立 。 同 样 地 ， 如 果 一 个 过 程 可 以 返回 诸如 闭 包 这 样 
的 包含 对 其 局 部 变量 的 显 式 或 隐 式 引用 的 对 象 ， 那 么 栈 分 配 不 再 局 部 数据 区 域 
适合 ， 因 为 栈 分 配 将 留 下 悬挂 指针 。 在 这 些 情 况 下 ， 可 以 将 AR 
保存 在 堆 存储 区 域 中 。Scheme 和 ML 的 实现 都 使 用 堆 分 配 的 AR 。 
这 样 的 分 配方 案 要求 代 码 拆除 并 释放 不 再 需要 的 AR。 在 垃圾 回 
收 系统 (garbage-collected system) 中 ， 回 收 器 可 以 回收 这 一 空 
间 (参见 6.7 节 )。 

现代 内 存 分 配器 可 以 把 堆 分 配 的 代价 维持 在 一 个 很 低 的 水 平 
(参见 6.7.2 节 )。 使 用 堆 分 配 AR， 可 以 把 可 变 大 小 的 对 象 作为 独 
立 的 堆 对 象 进 行 分 配 。 这 复杂 化 显 式 释放 系统 的 释放 ; 在 隐 式 释放 系统 中 ， 垃 圾 回收 器 将 回收 那些 不 可 
达 的 可 变 大 小 对 象 的 空间 。 为 了 追踪 整个 执行 路 径 ， 调 式 器 必须 从 当前 的 AR 向 回 追 踪 调 用 者 ARP 链 。 

(3) 活动 记录 的 静态 分 配 

如 果 一 个 过 程 4 不 调用 其 他 过 程 ， 那 么 4 可 能 绝 没 有 多 个 活动 的 调用 。 我 们 称 4 为 一 个 叶 过 程 (leaf 
procedure )， 因 为 它 终止 可 能 过 程 调用 图 的 一 条 路 径 。 编 译 器 可 以 为 叶 过 程 静态 地 分 配 活动 记录 。 从 而 
消除 AR 分 配 的 运行 时 代价 。 如 果 这 一 调用 约定 需要 调用 者 保存 它 自己 的 寄存 器 ， 那 么 gq 的 AR 不 需要 寄 
存 器 保存 区 域 。 

如 果 这 一 语言 有 类 似 于 Pascal 的 调用 和 返回 机 制 ， 那 么 编译 器 可 以 比 为 每 一 个 叶 过 程 分 配 一 个 静态 
AR 做 得 更 好 。 在 执行 期 间 的 任意 点 处 ， 只 有 一 个 叶 过 程 可 以 是 活动 的 。( 如 果 有 两 个 这 样 的 过 程 是 活动 
的 ， 那么 第 一 叶 过 程 将 需要 调用 另外 一 个 过 程 ， 所 以 它 不 是 叶 过 程 。) 因此 ， 编 译 器 可 以 为 所 有 的 叶 过 
程 分 配 一 个 的 静态 AR。 这 一 静态 AR 必须 足够 大 以 便 适 应 这 一 程序 的 所 有 叶 过 程 。 在 任意 叶 过 程 内 声明 
的 静态 变量 都 可 以 在 那个 单一 的 AR 内 进行 布局 。 叶 过 程 单一 静态 AR 所 用 的 空间 要 小 于 为 每 一 个 叶 过 程 
分 配 独立 的 静态 AR 所 需要 的 空间 。 

当然 ， 禁 止 递 归 的 任意 程序 设计 语言 都 可 以 静态 地 分 配 所 有 的 AR。FORTRAN 77 具 有 这 一 性 质 。 
然而 ， 给 每 个 过 程 创建 一 个 静态 分 配 的 数据 区 域 可 能 增加 程序 的 内 存 需 要 总 量 。 除 非 某 一 执行 路 径 上 的 
每 一 过 程 都 是 活动 的 ， 完 全 静态 解决 方案 的 AR 使 用 空间 比 基 于 栈 的 解决 方案 的 使 用 空间 大 。 作 为 一 个 
选择 ， 编 译 器 也 许 要 计算 任意 调用 链 所 需要 的 空间 最 大 量 ; 然后 ， 编 译 器 在 那个 空间 上 和 覆盖 AR。 在 实 
践 中 ， 这 产生 与 AR 的 栈 分 配 相同 的 代价 和 行为 。 

(4) 合并 活动 记录 

如 果 编 译 器 发 现 一 组 过 程 总 是 以 固定 的 顺序 调用 的 ， 那 么 编译 器 能 够 把 它们 的 活动 记录 组 合 起 来 。 
例如 如果 从 p 到 gq 的 调用 总 是 产生 对 r 和 s 的 调用 ， 那 么 编译 器 也 许 会 发 现在 同一 时 间 为 g、r 和 s 分 配 AR 





图 6-6 动态 尺度 的 数组 的 栈 分 配 


是 有 利 的 。 组 合 AR 可 以 节省 分 配 的 代价 ; 这 一 效益 直接 与 分 配 代 价 相 关 。 在 实践 中 ， 这 种 优化 受到 分 


块 编译 和 函数 值 参数 的 使 用 的 限制 。 此 二 者 都 限制 编译 器 确定 在 运行 时 实际 出 现 的 调用 关系 的 能 力 。 


6.3.3 面向 对 象 语言 的 名 字 空 间 


有 许多 文献 论述 面向 对 象 设计 、 面向 对 象 程序 设计 和 面向 对 象 语言 。 诸如 Smalltalk、C++、Self 和 
Java 等 已 开发 成 为 支持 面向 对 象 程序 设计 的 语言 。 许 多 其 他 语言 已 扩展 成 支持 面向 对 象 程序 设计 特性 的 
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语言 。 遗 憾 的 是 ， 术 语 面 向 对 象 (object-oriented) 已 被 赋予 了 过 多 不 同 的 意义 和 实现 ， 这 使 它 成 为 非常 
宽泛 的 语言 性 质 和 设备 的 象征 。 

从 根本 上 讲 , 面向 对 象 是 把 面向 过 程 方案 的 程序 名 字 空 间 重新 组 织 成 面向 数据 方案 的 程序 名 字 空 间 。 
本 节 以 结果 程序 的 名 字 空 间 的 观点 描述 面向 对 象 语言 的 性 质 。 它 把 由 面向 对 象 语言 创建 的 名 字 空 间 与 类 
Algol 语 言 中 的 名 字 空 间 相关 联 。 

在 过 程 语言 中 ， 作 用 域 效 应 伴随 着 代码 中 的 转换 而 出 现 ， 即 伴随 着 进入 一 个 过 程 或 块 以 及 离开 一 个 
过 程 或 块 而 出 现 。 在 面向 对 象 语言 中 ， 作 用 域 规则 和 命名 都 围绕 着 程序 中 的 数据 组 织 起 来 ， 而 不 是 围绕 
着 代码 组 织 起 来 。 传 统 上 控制 命名 规则 的 这 些 数据 项 被 称 为 对 象 (object)。 某 些 面 向 对 象 语言 要 求 每 一 
个 数据 项 都 是 对 象 ， 而 在 另外 一 些 面 向 对 象 语言 中 ， 对 象 和 代码 都 可 以 包含 与 类 Alogl 语 言 中 的 变量 功 
能 类 似 的 数据 项 。 

从 编译 器 设计 者 的 角度 看 ， 面 向 对 象 语 言 不 同 于 过 程 语言 的 地 方 在 于 它们 需要 额外 的 编译 时 和 运行 
时 支持 。 为 了 理解 这 些 额外 的 机 制 ， 我 们 必须 首先 考虑 对 象 抽象 ， 然 后 再 把 它们 与 过 程 抽 象 联系 起 来 。 

1. 对 象 和 类 

面向 对 象 程序 设计 的 核心 是 对 象 的 概念 。 一 个 对 象 是 一 个 抽象 ， 它 有 一 个 或 多 个 内 部 成 员 。 这 些 成 
员 可 以 是 数据 项 、 处 理 这 些 数据 项 的 代码 或 其 他 对 象 。 作 为 一 个 软件 工程 策略 ， 对 象 被 用 于 强制 抽象 、 
数据 隐藏 以 及 控制 对 存放 于 这 一 对 象 的 成 员 内 的 信息 的 存 取 。 

用 图 形 表 示 ， 我 们 可 以 把 对 象 表示 成 成 员 的 数组 或 结构 ， 且 有 这 样 的 规定 : 成 员 可 以 是 数据 项 、 可 
执行 过 程 或 其 他 对 象 。 





这 个 图 展示 名 为 a 和 b 的 两 个 对 象 。 这 两 个 对 象 有 相同 的 布局 ; 每 一 个 对 象 有 五 个 成 员 。 前 两 个 成 员 
x 和 y 保 存 数 。 第 三 个 成 员 z 保 存 一 个 对 象 。 后 两 个 对 象 fee 和 fie 保 存 可 执行 函数 。 为 了 可 以 统一 地 处 理 
成 员 ， 我 们 给 出 的 对 象 成 员 和 代码 成 员 是 由 指针 实现 的 。 

前 述 的 图 突出 对 象 的 简单 模型 的 实现 问题 ， 为 了 实现 fee 和 fie 这 一 代码 的 不 同 拷贝 浪费 空间 。 如 果 
代码 成 员 是 用 指针 实现 的 ， 那 么 a 和 b 可 以 使 用 fee 和 fie 的 相同 拷贝 。 





通过 处 理 源 语言 中 的 指针 来 描述 这 种 代码 的 复 用 也 许 是 乏味 的 。 为 了 支持 代码 的 复 用 ， 大 多 数 面向 
对 象 语言 都 引入 类 (class) 的 概念 。 一 个 类 是 把 类 似 的 对 象 组 织 到 一 起 的 抽象 。 一 个 类 中 的 所 有 对 象 都 
有 相同 的 布局 。 一 个 类 中 的 所 有 对 象 使 用 相同 的 代码 成 员 。 一 个 类 中 的 所 有 对 象 有 它们 自己 的 数据 和 对 
象 成 员 。 所 有 成 员 函 数 都 是 由 类 来 描述 的 。 通 过 对 类 的 引用 来 创建 或 实例 化 各 个 对 象 。 

通过 要 求 每 个 对 象 都 是 某 个 类 的 成 员 ， 实 现 可 以 通过 把 类 的 代码 成 员 存 储 在 表示 这 个 类 的 一 个 对 象 
中 来 优化 空间 的 使 用 。 这 给 保存 这 个 对 象 的 类 的 每 一 个 对 象 添 加 一 个 成 员 。 它 给 每 一 个 代码 成 员 的 引用 
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增加 一 个 间接 的 层次 。 用 图 来 表示 ， 这 可 以 表示 成 如 下 : 





这 里 ，one 是 a 和 b 的 类 。 它 保存 fee 和 fie 的 代码 ，a 和 b 使 用 这 一 代码 。a 和 b 的 表示 已 经 改变 ， 因 为 
fee 和 fie 的 表示 已 移 到 了 one 中 。 另 外 ， 现 在 a 和 b 的 对 象 记录 包含 一 个 指向 one 的 指针 。 类 one 有 其 自己 
的 私有 变量 n。 

2. 术语 

这 一 实现 图 已 变 得 相当 复杂 ， 使 得 我 们 有 必要 引入 与 各 部 分 相关 的 术语 。 

(1) 实例 

实例 (instance) 是 我 们 作为 对 象 所 考虑 的 事物 。 一 个 实例 是 一 个 属于 某 个 类 的 对 象 。 为 了 规整 起 
见 ， 我 们 假设 每 一 个 对 象 都 是 某 个 类 的 实例 。 

(2) 对 象 记 录 

实例 的 具体 表示 就 是 它 的 对 象 记录 (object record)。 对 象 记录 包含 它 的 所 有 成 员 (或 指向 它们 的 
指针 ) 。 

(3) 实例 变量 

对 象 的 数据 成 员 被 称 为 实例 变量 (instance variable )。 在 我 们 的 图 表 中 ，a 的 实例 变量 x 的 值 为 2。 在 
Java 中 ， 实 例 变量 被 称 为 域 (field)。 类 one 也 有 一 个 实例 变量 n。 

(4) 方法 

某 个 类 的 对 象 共 同 拥有 的 每 一 个 代码 成 员 或 过 程 称 为 一 个 方法 (method) 。 方 法 是 完整 的 过 程 。 它 
们 可 以 有 参数 、 局 部 变量 和 返回 值 。 

面向 对 象 语言 中 的 方法 与 Pascal 语 言 中 的 过 程 之 间 的 差异 在 于 其 命名 的 机 制 不 同 。 只 能 针对 于 一 个 
对 象 来 命名 一 个 方法 。 因 此 ， 在 Java 语 言 中 程序 员 不 能 调用 fee ， 而 必须 写成 a.fee， 其 中 a 是 实现 fee 的 
某 个 类 的 实例 。 

(5) 接受 者 

我 们 针对 某 个 对 象 调 用 方法 ， 这 个 对 象 就 是 这 个 方法 的 接受 者 〈receiver)。 在 实践 中 ， 实 现 给 这 个 
方法 增加 一 个 隐 式 的 参数 ， 而 这 个 参数 带 有 一 个 指向 适当 对 象 记录 的 指针 。 在 这 一 方法 的 内 部 ， 可 以 使 
用 一 个 指定 的 名 字 ， 如 this 或 se1f 来 存 取 这 一 接受 者 。 

_ Java 对 a.fee 的 调用 中 ，a 成 为 fee 内 部 的 接受 者 ， 而 且 可 以 通过 名 字 this 来 对 其 进行 存 取 。 

(6) 类 

类 (class) 是 描述 其 他 对 象 性 质 的 对 象 。 特 别 地 ， 类 定义 为 这 个 类 的 每 一 个 对 象 指定 实例 变量 和 方 
法 。 方 法 成 为 这 个 类 的 实例 变量 。 

(7) 类 变量 

每 一 个 类 可 以 有 实例 变量 ， 它 们 通常 被 称 为 类 变量 (class variable )。 它 们 提供 一 种 永久 的 存储 形式 
并 使 其 对 这 个 类 中 的 所 有 方法 可 视 ， 这 种 存储 形式 独立 于 当前 接受 者 。 

因为 这 与 类 Algol 语 言 中 的 静态 变量 在 行为 及 使 用 上 的 相似 性 ，Java 和 C++ 都 在 类 定义 中 把 这 些 变量 
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声明 为 静态 (static) 变量 。 因 此 ， 类 的 局 部 变量 成 为 实例 变量 ,而 类 的 静态 变量 成 为 类 变量 。 在 图 中 ， 
类 one 的 实例 变量 n 是 一 个 类 变量 。 

3. 继承 

大 多 数 面向 对 象 语言 包含 继承 (inheritance) 的 概念 。 继 承 给 出 类 上 的 一 种 祖先 关系 ， 每 个 类 有 一 
个 或 多 个 父 类 ， 通常 被 称 为 超 类 (superclass )。 如 果 B 是 a 的 超 类 ， 那 么 a 是 6 的 子 类 (subclass )，B 的 方 
法 只 要 在 a 内 是 可 视 的 ， 那 么 它 对 类 a 的 对 象 也 适用 。 

(相反 ， 不 能 期 待 a 的 方法 能 对 类 B 的 对 象 适用 ， 因为 a 的 方法 可 以 存 取 类 a 的 对 象 所 有 的 附加 状态 。 
当 a 的 方法 运用 到 类 PB 的 对 象 上 时 ， 这 一 附加 状态 将 遗失 。 如 果 这 一 调用 的 确 出 现 了 ， 结 果 很 可 能 是 灾难 
性 的 : 当 这 一 方法 试图 存 取 这 一 遗失 的 状态 时 ， 将 出 现 某 种 运行 时 错误 .) 

继承 允许 程序 员 通 过 把 共用 的 方法 放 在 超 类 中 ， 并 为 具有 不 同行 为 的 方法 使 用 不 同 的 子 类 来 复 用 代 
码 。 当 然 ， 继 承 要 求 子 类 有 它 的 超 类 指定 的 所 有 实例 变量 : 超 类 的 方法 必须 适用 于 子 类 对 象 的 显然 要 求 。 
另外 ， 把 方法 名 转换 成 可 执行 过 程 的 机 制 必 须 以 一 种 自然 的 方式 向 上 沿 着 超 类 链 扩展 。 这 一 典型 的 规则 
的 工作 方式 与 词法 作用 域 符号 表 类 似 ; 如 果 在 对 象 自 身 的 类 中 没有 找到 这 一 方法 ， 那 么 就 要 按 继 承 顺 序 
搜寻 这 一 对 象 的 超 类 。 调 用 者 使 用 所 发 现 的 第 一 个 实现 。 

图 6-7 给 出 一 个 例子 。 如 前 面 一 样 ， a 和 b 是 类 one 的 成 员 。 现 在 ，one 有 超 类 two，, 而 two 有 超 类 three。 
one、two 和 three 都 实现 方法 fee。 另 外 ， 它 们 中 的 每 一 个 都 实现 另外 一 个 方法 : one 实 现 fie，two 实 现 
foe，three 实 现 fum。 上 图 给 出 第 三 个 对 象 c， 它 是 two 的 实例 。 它 有 实例 变量 x 和 y， 但 是 类 two 的 对 象 
HZ. © 








图 6-7 在 超 类 继承 中 寻找 方法 


4. 将 名 字 映 射 到 方法 

在 一 个 面向 对 象 语言 中 ， 必 须 针 对 一 个 特定 对 象 调用 函数 ， 这 一 特定 对 象 成 为 接受 者 。 再 次 考虑 图 
6-7 的 结构 。 如 果 程 序 调 用 one.fee， 那 么 它 应 该 找到 在 类 one 中 定义 的 方法 fee。c.fee 的 一 次 调用 应 该 
找到 在 类 two 中 定义 的 fee。 最 后 b .fum 的 调用 应 该 找到 在 类 three 中 的 实现 。 

从 概念 上 ， 方 法 查找 就 如 同 过 程 调用 的 查找 一 样 。 对 一 个 方法 的 搜索 开始 于 接受 者 的 类 。 如 果 这 一 
搜索 失败 ， 它 移 升 到 接受 者 的 超 类 中 去 。 这 一 过 程 反复 进行 ， 移 升 到 超 类 链 直 到 这 一 搜索 或 者 定位 这 一 
方法 或 者 用 尽 这 一 超 类 链 而 失败 。 因 此 ， 搜 索 或 者 返回 找到 的 第 一 个 实现 ， 或 者 报告 失败 。 

这 一 方案 的 一 个 结果 就 是 前 面 所 提 到 的 不 会 产生 对 方法 的 误 用 。 方 法 查寻 机 制 保证 类 c 的 对 象 永远 


日 这 一 图 仅仅 是 一 个 图 示 ; 它 在 对 象 记 录 中 使 用 同一 个 槽 作为 对 象 (a、b 和 c) 的 类 指针 和 类 (one、two 和 
three) 中 的 超 类 指针 。 在 实际 的 实现 中 ， 超 类 指针 将 是 每 个 类 的 对 象 记录 中 的 一 个 独立 域 。 ROBB 
无 疑问 指向 类 c1ass。 
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不 是 a 的 子 类 的 方法 的 接受 者 。 方 法 查寻 沿 超 类 链 向 上 行进 ， 而 不 是 向 下 行进 。 这 使 我 们 回忆 起 强 类 型 
语言 的 规则 : 方法 只 在 该 方法 有 定义 的 接受 者 上 执行 。 

如 图 所 示 ， 实 现 继承 需要 小 心地 生成 运行 时 数据 结构 以 支持 方法 的 定位 与 调用 ， 这 一 过 程 通常 被 称 
为 调度 (dispatching )。 函 数 调用 通常 不 能 像 类 Algol 语 言 那样 进行 。 考 虑 为 类 one 声 明 的 方法 fee 内 部 发 
生 的 一 切 。 如 果 fee 的 方法 调用 fie， 也 就 是 one 所 实现 的 另外 一 个 方法 ， 那 么 编译 器 直接 生成 调用 fie 的 
代码 吗 ? 如 果 one 没 有 子 类 ， 那 么 对 fie 直 接 调 用 必定 产生 正确 的 行为 。 

然而 ， 如 果 one 有 一 个 或 多 个 子 类 ， 那 么 对 fie 的 调用 必须 通过 类 层次 间接 地 进行 处 理 。 如 果 fie 的 
接受 者 是 one 的 某 个 子 类 的 元 素 而 且 那 个 子 类 实现 了 它 自己 的 fie， 那 么 这 个 间接 调用 将 使 用 这 个 对 象 的 
类 指针 ， 这 导致 fie 的 适当 实现 。 将 fee 的 实现 直接 编译 到 one 中 将 导致 调用 错误 的 fie。 

为 了 使 调度 更 高 效 ， 实 现 可 以 在 每 一 个 类 中 放置 一 个 完整 的 方法 表 ， 如 图 6-8 所 示 。 如 果 类 结构 可 
以 完全 在 编译 时 确定 ， 那 么 这 一 方法 表 可 以 是 静态 的 。 构 建 这 个 表 很 容易 。 编 译 器 仅仅 把 继承 层次 当 作 
一 个 有 序 的 作用 域 集 合 来 处 理 (每 一 个 类 有 一 个 符号 表 ， 从 子 类 向 超 类 链接 ， 如 5.7.4 节 所 述 。) 在 这 样 
的 作用 域 表 内 对 一 个 方法 名 的 查寻 将 把 该 方法 名 解析 为 出 现 于 这 个 类 的 方法 表 的 实现 。 

如 果 类 结构 是 可 变 的 ， 或 它 在 编译 时 是 不 可 知 的 ， 那 么 实现 可 以 在 类 层次 中 使 用 完整 查寻 ， 它 也 可 
以 使 用 完整 的 方法 表 并 包含 随时 更 新 这 些 方法 表 的 机 制 。 前 者 的 策略 产生 一 个 类 似 于 如 图 6-7 所 示 的 运行 
时 表示 。 调 度 包 括 向 上 追踪 类 层次 到 适当 的 层次 ， 并 调用 在 那里 找到 的 方法 。 后 者 的 策略 使 用 如 图 6-8 所 
示 的 运行 时 表示 。 例 如 ， 当 通过 用 一 个 新 类 的 定义 取代 某 个 类 的 定义 而 使 类 结构 发 生变 化 时 ， 运 行 时 系 
统 必 须 为 所 有 受到 影响 的 类 重建 这 个 表 。 





图 6-8 在 每 一 类 中 带 有 完整 方法 表 的 类 层次 示例 


5. 名 字 可 视 性 规则 

从 执行 方法 的 角度 看 ， 而 向 对 象 语言 和 闫 Algol 语 言 之 间 的 主要 差异 在 于 方法 所 能 存 取 的 变量 信人 
不 同 。 在 类 Algol 语 言 中 ， 例 如 在 Pascal 中 ， 作 用 域 规则 是 以 过 程 为 中 心 的 。 每 一 个 过 程 可 以 存 取 它 自己 
的 参数 和 变量 、 包 围 词法 作用 域 中 的 那些 参数 和 变量 以 及 任意 全 局 名 字 。 在 面向 对 象 语言 中 ， 存 取 规 则 
是 以 对 象 为 中 心 的 

当 程序 调用 方法 one.fee 时 ， 这 一 方法 能 够 存 取 什么 呢 ? 首先 ，fee 可 以 存 取 在 这 一 方法 内 局 部 声明 
的 任意 名 字 ， 包 括 被 传递 的 任意 参数 。fee 的 代码 可 以 包含 词法 储 套 作用 域 ， 这 些 作 用 域 的 行为 方式 与 
它们 在 类 Algol 语 言 中 的 行为 方式 一 样 。( 这 表明 对 一 个 方法 的 调用 创建 一 个 活动 记录 。) 其 次 ，fee 可 以 
存 取 它 所 知道 的 one 的 任意 实例 变量 。( 如 果 fee 是 一 个 超 类 方法 ， 它 也 许 看 不 到 one 的 所 有 实例 变量 。) 
再 次 ， 这 一 方法 可 以 存 取 定义 fee 的 类 的 类 变量 ， 以 及 任意 超 类 的 类 变量 。 最 后 ， 如 果 语 计 支持 全 局 名 
字 作 用 域 ， 这 一 方法 可 以 存 取 全 局 变量 。 
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为 了 使 上 面 的 讨论 更 具体 ， 回 到 图 6-7。 对 于 接受 者 b 调 用 foe 使 得 foe 可 以 存 取 b 的 对 象 记录 中 的 x 和 
y 的 值 ， 但 不 能 存 取 z 的 值 ， 因 为 foe 是 在 类 two 中 声明 的 ， 而 two 只 声明 了 x 和 y。Foe 可 以 存 取 two 中 的 所 
有 类 变量 ， 以 及 three 中 的 所 有 类 变量 (以 及 这 一 链 中 其 他 超 类 中 的 类 变量 )。Foe 不 能 存 取 one 中 的 类 变 
量 ， 因 为 它 不 能 存 取 子 类 中 的 任意 实现 。 

与 此 相对 ， 对 于 接受 者 b 调 用 fee 使 得 fee 可 以 存 取 b 的 所 有 实例 变量 ， 因 为 声明 fee 的 类 是 one。Fee 

.也 可 以 存 取 one、two 和 three 的 类 变量 。- . 

因为 在 一 个 方法 中 可 视 的 名 字 集 合 很 大 程度 上 取决 于 这 一 语言 的 类 结构 ， 在 面向 对 象 语 言 中 的 参数 
传递 比 典型 类 Algol 语 言 中 的 参数 传递 更 为 重要 。 在 一 个 方法 内 ， 代 码 可 以 调用 另 一 个 方法 仅 当 这 一 方 
法 有 适当 的 接受 者 对 象 ， 这 些 对 象 通常 必须 或 者 是 全 局 变量 或 者 是 参数 。 


6.4 ”过程 间 的 值 传递 


过 程 的 概念 的 核心 是 抽象 。 程序 员 抽象 出 与 一 小 组 名 字 即 形 参 (formal parameter) 相关 的 公共 操作 ， 
并 把 这 些 操作 封装 到 一 个 过 程 中 。 为 了 使 用 过 程 ， 程 序 员 通 过 把 适当 的 值 即 实 参 (actual parameter) 4 
定 到 形 参 来 调用 它 。 被 调用 过 程 的 执行 通过 形 参 名 字 存 取 实 参 传递 的 值 。 它 还 可 以 返回 一 个 结果 。 


6.4.1 参数 传递 


在 调用 点 参数 绑 定 把 实 参 映射 到 被 调用 过 程 的 形 参 。 这 使 程序 员 能 够 在 没有 过 程 运行 的 上 下 文 信息 
的 情况 下 编写 这 一 过 程 。 而 且 它 使 程序 能 够 在 没有 过 程 的 内 部 操作 的 信息 的 情况 下 ， 在 不 同 的 上 下 文 调 
用 这 一 过 程 。 参 数 绑 定 对 于 编写 抽象 的 模块 化 代码 的 能 力 是 至 关 重 要 的 。 

大 多 数 现代 程序 设计 语言 使 用 两 个 约定 中 的 一 个 来 在 调用 点 把 实 参 映射 到 在 被 调用 过 程 内 声明 的 形 
参 ， 即 值 调 用 (call-by-value) 绑 定 和 引用 调用 (call-by-reference) 绑 定 。 尽 管 这 些 技术 在 行为 上 不 同 ， 
它们 之 间 的 差异 可 以 通过 理解 它们 的 实现 而 得 到 最 好 的 解释 。 

1. 值 调 用 

275 考虑 下 面 用 C 语 言 写 成 的 过 程 以 及 几 个 调用 它 的 地 点 : 


int Tt x, int y) { 
X=2* . 
y=XxX+ yi 
return y; 


N 
J 
A 


(2 -i -EE e BE ~ a -E a) 
E ANNU 


如 在 C 语 言 中 那样 ， 对 于 值 调 用 调用 者 把 实 参 的 值 拷贝 到 对 应 形 参 的 适当 位 置 : 或 者 是 一 个 寄存 器 ， 
或 者 是 被 调用 者 的 AR 中 的 参数 槽 。 仅 有 一 个 名 字 引 用 实 参 值 ， 这 就 是 形 参 的 名 字 。 形 参 名 的 初始 值 是 
由 调用 时 对 实 参 的 评估 来 确定 的 。 如 果 被 调用 者 改变 它 的 值 ， 那 么 这 一 改变 在 被 调用 者 中 是 可 视 的 ， 但 
在 调用 者 中 是 不 可 视 的 。 

当 使 用 值 调用 参数 绑 定 来 调用 时 ， 上 面 的 三 次 调用 产生 下 面 的 结果 : 










fee(2，3) 
fee(a, b) 
fee(a, a) 
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使 用 值 调 用 ， 绑 定 既 简单 又 直观 。 

值 调 用 的 一 个 变形 是 值 结果 调用 。 在 值 结果 方案 中 ， 作 为 从 被 调用 者 到 调用 者 返回 控制 过 程 的 一 部 
分 ， 形 参 的 值 被 拷贝 回 实 参 。Ada 语 言 包含 值 结果 参数 。 值 结果 机 制 还 满足 FORTRAN 77 语 言 定 义 中 的 
规则 。 | 

2. 引用 调用 -o 

对 于 引用 调用 参数 传递 ， 调 用 者 在 每 一 个 参数 的 AR 槽 内 存储 一 个 指针 。 如 果实 参 是 一 个 变量 ， 那 
么 它 把 这 个 变量 的 地 址 存储 在 内 存 中 。 如 果实 参 是 一 个 表达 式 ， 那 么 调用 者 评估 这 个 表达 式 ， 并 把 其 评 
估 结 果 存 储 在 它 自 己 的 AR 中 ， 然 后 把 指向 这 一 结果 的 指针 存储 在 被 调用 者 的 AR 中 的 适当 参数 槽 内 。 把 
常量 作为 表达 式 处 理 避 免 被 调用 者 改变 一 个 常量 值 的 可 能 性 。 一 些 语言 禁止 把 表达 式 作为 实 参 传递 给 引 
用 调用 的 形 参 。 l 
名 字 调 用 参数 绑 定 


Algol 引 入 另外 一 种 参数 九 定 机 制 ， 称 为 名 字 调 用 (call by name)。 在 名 字 调 用 绑 定 中 ， 对 形 参 | 
| 的 引用 行为 是 : 通过 适当 的 重新 命名 ， 形 参 被 实 参 位 置 上 的 文本 所 替换 。 这 一 简单 的 规则 可 能 导致 | 
复杂 的 行为 。 考 虑 下 面 Algol OPM AGH FT: 


begin comment Simple array example; 
procedure zero(Arr,i,j,ul,u2); 
integer Arr; 
integer i,j,ul,u2; 
begin; 
for i := 1 step 1 until ul do 
for j := 1 step 1 until u2 do 
Arr := 0; 
end; 
integer array Work[1:100, 1:200]; 
integer P, qs X», Y, Z; 
x := 100; 
y := 200; 
zero(Work[p,q] ,p,9,xX,y); 
end 


对 zero 的 调用 把 0 赋值 给 数组 Work 的 每 一 个 元 素 。 为 了 明白 这 一 点 ， 请 读者 使 用 实 参 的 文本 重 写 | 
1 zero. 

尽管 名 字 调 用 绑 定 很 容易 定义 ， 但 是 它 很 难 实现 和 理解 。 对 每 一 个 形 参 ， 编 译 器 通常 必须 产生 | 
评估 这 个 实 参 到 返回 一 个 指针 的 函数 。 这 些 函 数 被 称 为 形 实 转 换 程 序 〔thunks)。 生 成 适当 的 形 实 转 | 
换 程序 很 复杂 ; 为 每 一 个 参数 存 取 评估 形 实 转换 程序 的 代价 很 高 。 最 终 ， 这 些 缺点 超过 了 名 字 调 用 | 
参数 绑 定 所 提供 的 优点 。 


在 被 调用 过 程 内 部 ， 对 引用 调用 形 参 的 每 一 次 引用 都 包括 一 个 额外 的 间接 层次 。 引 用 调用 在 下 面 两 
个 重要 方面 不 同 于 值 调用 。 第 一 ， 一 个 引用 形 参 的 任意 再 定义 都 在 相应 的 实 参 中 得 到 反映 。 第 二 ， 任 意 
引用 形 参 可 以 被 绑 定 到 由 被 调用 过 程 内 部 的 另外 一 个 名 字 存 取 的 一 个 变量 上 。 当 上 述 事件 发 生 时 ， 我 们 
说 这 些 名 字 是 别名 (aliase)， 因 为 它们 引用 相同 的 存储 位 置 。 别 名 化 可 能 产生 非 直观 的 行为 。 

考 虚 前 面 的 例子 ， 使 用 FORTRAN 77 重 写 它 ， 它 使 用 引用 调用 参数 绑 定 。 
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integer function fee(x,y) c = fee(2,3) 
integer x, y a=2 
x2=2* x b=3 . 
y=x+y c = fee(a,b) 
fee=y a=2 
end b=3 . 
c =.fee(a,a) 


使 用 引用 调用 参数 绑 定 ， 这 一 例子 产生 不 同 的 结果 。 我 们 假设 FORTRAN 编 译 器 用 直观 的 方式 处 理 
别名 参数 ， 即 使 FORTRAN 77 标 准 认 为 最 后 的 调用 fee(a，a) 不 是 “标准 相 容 的 ”。 










fee(2，3) 
fee(a, b) 
fee(a, a) 


注意 第 二 次 调用 重新 定义 a 和 b; 引用 调用 的 行为 倾向 于 将 被 调用 过 程 中 的 更 改 传递 到 调用 环境 中 。 
第 三 个 调用 使 得 x 和 y 在 fee 中 互 为 别名 。 第 一 条 语句 重新 定义 8a， 使 其 具有 值 f。 下 一 条 语句 两 次 引用 a 的 
值 ， 并 把 a 的 值 加 到 它 自身 ， 而 且 重 新 定义 a 使 其 具有 值 8。 这 使 得 fee 返 回 值 8 而 不 是 6。 

在 值 调用 和 引用 调用 中 ， 表 示 参 数 所 需要 的 空间 都 很 小 。 因 为 每 一 个 参数 的 表示 必须 在 每 一 次 调用 
时 被 拷贝 到 被 调用 过 程 的 AR 中 ， 这 对 调用 的 代价 产生 影响 。 通 过 值 传递 较 大 的 对 象 要 承受 拷贝 整个 对 
象 的 负担 。 有 些 语言 允许 通过 引用 传递 数组 和 结构 。 而 其 他 语言 则 包括 一 些 装置 让 程序 员 得 以 指定 通过 
引用 传递 特殊 参数 ; 例如 ，C 语 言 中 的 const 属 性 向 编译 器 保证 带 有 这 一 属性 的 参数 不 被 修改 。 


6.4.2 返回 值 


为 了 从 函数 返回 一 个 值 ， 与 改变 它 的 一 个 实 参 的 值 相反 ， 编 译 器 必须 为 这 一 返回 值 设置 空间 。 因 为 
根据 定义 ， 这 个 返回 值 是 在 被 调用 过 程 终止 后 才 被 使 用 的 ， 所 以 编译 器 需要 把 它 存储 在 被 调用 过 程 的 
AR 的 外 面 。 如 果 编 译 器 设计 者 能 够 保证 这 个 返回 值 有 一 个 较 小 的 固定 大 小 ， 那 么 编译 器 或 者 把 这 个 值 
存储 在 调用 者 的 AR 中 或 存储 在 一 个 指定 的 寄存 器 中 。 

我 们 所 有 的 AR 图 都 含有 一 个 返回 值 槽 。 为 了 使 用 这 个 槽 ， 调 用 者 在 它 自己 的 AR 内 为 这 个 返回 值 分 
配 空 间 ， 并 把 指向 那个 空间 的 指针 存储 在 它 自己 的 AR 的 返回 槽 内 。 被 调用 者 可 以 从 调用 者 的 返回 值 醒 
装 入 这 一 指针 (使 用 在 被 调用 者 AR 内 的 调用 者 ARP 的 拷贝 }。 被 调用 者 可 以 使 用 这 一 指针 存 取 为 这 个 
返回 值 而 设置 在 调用 者 AR 中 的 存储 单元 。 只 要 调用 者 和 被 调用 者 都 接受 这 个 返回 值 的 大 小 ， 这 就 是 可 

如 果 调 用 者 不 知道 返回 值 的 大 小 ， 被 调用 者 也 许 需要 给 这 个 返回 值 分 配 空间 ， 这 个 空间 通常 是 分 配 
在 堆 上 。 在 这 种 情况 下 ， 被 调用 者 分 配 空间 ， 把 这 个 返回 值 存储 在 那里 ， 并 把 这 个 指针 存储 在 调用 者 
AR 的 返回 值 槽 中 。 这 样 ， 调 用 者 可 以 使 用 在 它 的 返回 值 槽 中 找到 的 指针 来 存 取 返 回 值 。 

如 果 调 用 者 和 被 调用 者 都 知道 这 一 返回 值 较 小 ， 也 就 是 说 返回 值 槽 的 大 小 较 小 ， 那 么 它们 可 以 消除 
这 一 间接 的 操作 。 对 于 较 小 的 返回 值 ， 被 调用 者 可 以 直接 把 这 一 值 存储 到 调用 者 AR 的 返回 值 槽 内。 于 
是 ， 调 用 者 可 以 直接 使 用 它 的 AR 中 的 这 个 值 。 当 然 ， 这 一 改进 要 求 调用 者 和 被 调用 者 能 识别 出 这 种 情 
况 并 使 用 同样 方式 处 理 这 种 情况 。 

(这 一 改进 导致 在 同一 机 器 上 对 于 同一 语言 的 不 同 编译 器 之 间 不 相 容 的 最 好 例子 。 想 像 两 个 编译 器 ， 
一 个 是 实现 这 一 改进 的 编译 器 ， 而 另外 一 个 是 没有 实现 这 一 改进 的 编译 器 。 如 果 一 个 可 执行 代码 包含 这 
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两 个 编译 器 编译 的 代码 ， 那 么 它 可 能 由 于 对 返回 值 做 指针 的 解除 引用 而 陷 人 莫名 其 妙 的 运行 时 错误 。 这 
种 灾难 性 失败 的 可 能 性 通常 阻止 编译 器 设计 者 对 连接 约定 做 任何 哪怕 是 微小 的 改动 。) 


6.5 建立 可 寻 址 性 


作为 连接 约定 的 一 部 分 ， 编 译 器 必须 保证 每 一 个 过 程 为 所 需 引 用 的 每 一 个 变量 生成 一 个 地 址 。 在 类 
Algol 语 言 中 ， 过 程 可 以 引用 全 局 变量 、 局 部 变量 以 及 在 周围 词法 作用 域内 声明 的 任意 变量 。 地 址 计算 
一 般 由 两 部 分 组 成 : 寻找 包含 这 一 值 的 作用 域 的 内 存 块 地 址 ， 称 为 数据 区 (data area) ; 以 及 寻找 这 一 
数据 区 内 的 偏 移 。 


6.5.1 平凡 基地 址 


对 于 很 多 变量 ， 编 译 器 都 可 使 用 一 个 或 两 个 指令 发 行 生成 基地 址 的 代码 。 最 容易 的 情况 是 当前 过 
程 的 局 部 变量 。 如 果 这 个 局 部 变量 被 存储 在 这 一 过 程 的 AR 中 ， 那 么 编译 器 可 把 ARP 当 作 它 的 基地 址 。 
尽管 精确 的 操作 序列 取决 于 IR 所 能 表示 的 寻 址 模式 ， 但 是 存在 多 种 选择 。 这 其 中 包括 使 用 单一 的 “ 寄 
存 器 + 立即 偏 移 ” 操 作 ( 像 10adAI ) ， 如 果 这 一 偏 移 对 立即 域 来 说 太 大 ， 则 使 用 一 个 “地 址 + 偏 移 ” 操 作 
( 像 1oadA0 )， 或 者 使 用 一 个 三 操作 序列 (1oadAI ,add,1oad)。 对 于 所 有 的 情况 ， 地 址 计算 都 应 该 是 快 
速 的 。 

(有 了 时候 ， 局 部 变量 没有 被 存储 在 距 过 程 的 ARP 一 个 常量 偏 移 的 位 置 上 。 值 也 许 在 一 个 寄存 器 中 ， 
在 这 一 情况 下 ， 装 入 和 存储 都 是 不 必要 的 。 如 果 变 量 的 大 小 不 可 预测 或 不 断 改变 ， 那 么 编译 器 将 把 这 个 
值 存储 在 用 来 保存 可 变 大 小 对 象 的 区 域内 ， 或 者 在 AR 的 尾部 或 者 在 堆 上 。 在 这 种 情况 下 ， 编 译 器 可 以 
在 AR 中 为 一 个 指向 变量 真实 位 置 的 指针 保留 一 个 空间 。 然 后 ， 编 译 器 需要 生成 一 个 额外 的 间接 寻 址 来 
存 取 这 一 变量 。) 

对 全 局 变量 和 静态 变量 的 存 取 的 处 理 是 类 似 的 ， 只 是 编译 器 可 能 需要 把 这 个 基地 址 装 和 人 到 一 个 寄存 
器 中 。 编 译 器 可 以 为 基地 址 发 行 一 个 符号 化 汇编 级 标签 的 立即 装 人 。 它 必须 使 用 一 致 性 规则 来 生成 这 样 
的 标签 。 编 译 器 一 般 使 用 在 源 语言 中 不 合法 的 字符 给 源 代码 名 字 加 上 一 个 前 级、 后 缀 或 者 两 者 都 加 上 。 
汇编 器 和 装 人 器 将 使 用 正确 的 运行 时 值 取代 这 一 符号 标签 。 

例如 ， 全 局 变量 fee 可 能 导致 一 个 标签 &fee.， 假设 (&) 和 (. ) 都 不 能 出 现在 源 语言 的 名 字 中 。 编 
译 器 将 发 行 适当 的 汇编 语言 伪 操 作 来 为 fee 保 留 空间 ， 并 把 这 一 标签 加 到 这 一 伪 操 作 上 。 为 了 让 fee 的 运 
行 时 地 址 进入 一 个 寄存 器 中 ， 编 译 器 将 发 行 诸如 10adI &fee. 二 r; 的 操作 。 下 一 个 操作 可 以 使 用 rr 来 存 
取 fee 的 内 存 位 置 。 

编译 器 无 需 知道 fee 的 存储 位 置 。 它 使 用 一 个 可 重 定位 标签 来 保证 适当 的 运行 时 地 址 被 写 人 到 指令 
流 中 。 立 即 装 入 操作 保证 r, 将 含有 这 一 适当 的 地 址 。 汇 编 器 、 链 接 器 和 装 入 器 都 把 符号 &fee .转换 成 运 
行 时 地 址 。 

全 局 变量 可 以 各 自 加 标签 或 在 一 个 较 大 的 组 群 加 标签 。 例 如 ， 在 FORTRAN 中 ， 语 言 把 全 局 变量 收 
集 到 共用 块 中 。 一 个 典型 的 FORTRAN 编 译 器 为 每 一 个 公用 块 创建 一 个 标签 。 它 给 每 一 个 公用 块 中 的 每 
一 个 变量 赋 一 个 偏 移 量 ， 且 生成 相关 于 公用 块 标签 的 装 和 人 (1oad) 和 存储 (store) 操作 。 如 果 数 据 区 
域 比 “寄存 器 + 偏 移 ” 操 作 所 允许 的 偏 移 量 大 ， 那 么 也 许 把 这 个 数据 区 域 分 成 车 干部 分 并 使 用 多 个 标签 
更 具 优 越 性 。 

同样 地 ， 编 译 器 可 以 把 单一 作用 域内 的 所 有 静态 变量 都 聚合 到 一 个 数据 区 内 。 这 减 小 不 希望 的 名 字 
冲突 的 可 能 性 ; TEBE ATE A RA) REAR BLA AR, MARR AT APRA. AT 
避免 这 样 的 冲突 ， 编 译 器 可 以 把 全 局 可 视 名 字 与 作用 域 结合 起 来 构造 标签 。 这 一 策略 还 减 小 过 程 所 使 用 
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的 基地 址 的 数目 ， 减 少 对 寄存 器 的 需求 。 使 用 过 多 的 寄存 器 来 保存 基地 址 可 能 给 整个 运行 时 执行 带 来 负 
面 影响 。 


6.5.2 其 他 过 程 的 局 部 变量 


在 一 个 词法 作用 域 语言 中 ， 编 译 器 必须 提供 把 静态 坐标 映射 到 相应 变量 的 硬件 地 址 上 的 机 制 。 为 了 
实现 一 点 ， 编 译 器 必须 适当 地 放置 数据 结构 让 编译 器 计算 包围 当前 过 程 的 词法 作用 域 的 AR 的 地 址 。 

例如 ， 假 设 fee 处 于 词法 层次 m， 且 它 引 用 处 于 层次 n 的 fee 的 词法 祖先 fie 内 声明 的 变量 a。 分 析 器 
把 这 一 引用 转换 成 静态 坐标 <n，o>， 其 中 o 是 fie 在 AR 内 的 偏 移 。 编 译 器 可 以 计算 出 fee 与 fie 之 间 的 词 
法 层次 数目 站 -1。( 坐标 <m 一 n, o> 称 为 静态 距离 坐标 (static-distance coordinate )。 这 一 坐标 描述 fee 的 
AR 与 fie 的 AR 之 间 的 词法 距离 ， 以 及 a 距 fie 的 ARP 的 偏 移 。) 

为 了 把 <n，o> 转 换 成 一 个 运行 时 地 址 ， 编 译 器 需要 跟踪 活动 记录 间 的 词法 祖先 的 机 制 。 编 译 器 必须 

281| ”发行 保 存 当前 运行 时 信息 所 需要 的 代码 。 然 后 ， 在 对 另 一 个 作用 域 的 一 个 局 部 变量 的 每 一 次 引用 时 ， 编 

译 器 必须 发 行使 用 这 一 运行 时 数据 结构 来 计算 所 需 地 址 的 代码 。 

有 若干 机 制 可 以 用 于 解决 这 一 问题 。 我 们 将 研究 其 中 的 两 个 机 制 ， 即 存 取 链 和 全 局 显示 。 

1. 存 取 链 

使 用 存 取 链 ， 编 译 器 保证 每 一 个 AR 包含 一 个 指向 它 的 立即 词法 祖先 的 AR 的 指针 。 代 码 使 用 这 一 称 
AA (access link) 或 静态 链 (static link) 的 指针 来 存 取 非 局 部 变量 。 存 取 链 形成 一 个 包含 当前 过 
程 的 所 有 词法 祖先 的 链 ， 如 图 6-9 所 示 。 因 此 ， 对 当前 过 程 为 可 视 的 另 一 个 过 程 的 所 有 局 部 变量 被 存储 
在 存 取 链 上 的 一 个 AR 中 。 
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图 6-9 使 用 存 取 链 


282 为 了 从 层次 m 的 过 程 中 存 取 一 个 变量 <n，o>， 编 译 器 发 行 遍历 这 一 链接 链 寻 找 层次 4 的 ARP 的 代码 。 
然后 ， 编 译 器 使 用 层次 x 的 ARP 和 o 发 行 一 个 装 和 人 。 为 了 使 这 一 讨论 更 具体 ， 考 虚 如 图 6-9 所 示 的 程序 。 
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假设 m 是 2， 且 这 一 存 取 链 存储 在 距离 ARP 偏 移 为 -4 的 地 方 。 下 面 的 表 给 出 编译 器 为 三 个 不 同 的 静态 坐 
标 所 生成 的 ILOC 代 码 。 左 栏 给 出 静态 坐标 ; 右 栏 给 出 相应 的 ILOC 代 码 。 每 一 列 把 结果 留 在 rs 中 。 


loadAI r,,,,24 =r, 
loadAlI r,,,,-4 =r; 
loadAI r,,12 =r; 
loadAI r,,,,-4 =srj 
loadAI r,,-4 =f] 
loadAI r,,16 =f; 





因为 ILOC 编 译 器 有 每 一 次 引用 的 静态 坐标 ， 所 以 它 可 以 计算 静态 距离 (m 一 n)。 这 一 距离 告诉 编译 器 
要 生成 多 少 个 持续 的 装 入 ， 所 以 编译 器 可 以 为 每 一 个 非 局 部 引用 发 行 正确 的 序列 。 地 址 计算 的 代价 与 静态 
距离 成 正比 。 如 果 程 序 显示 较 浅 的 词法 戏 套 ， 那 么 存 取 不 同 层次 上 的 两 个 变量 的 代价 差异 也 会 相当 小 。 

为 了 维护 存 取 链 ， 编 译 器 必须 给 每 一 个 过 程 调 用 添加 寻找 适当 ARP 并 将 其 作为 被 调用 者 的 存 取 链 存储 
起 来 的 代码 。 对 于 处 于 层次 m 的 调用 者 和 处 于 层次 n 的 被 调用 者 ， 可 能 发 生 下 面 三 种 情况 。 如 果 n==m 二 1， 
则 被 调用 者 姓 套 在 调用 者 内 ， 且 被 调用 者 可 以 把 调用 者 的 ARP 用 作 它 的 存 取 链 。 如 果 n=m， 被 调用 者 的 
存 取 链 与 调用 者 的 存 取 链 相同 。 最 后 ， 如 果 n<m， 被 调用 者 的 存 取 链 是 调用 者 的 n -1 层次 的 存 取 链 。( 如 
果 n 是 零 ， 则 存 取 链 是 空 的 ) 编译 器 可 以 生成 一 个 m — n+ 1 个 装 入 的 序列 来 寻找 这 一 ARP 并 把 它 作为 被 调 
用 者 的 存 取 链 存储 这 一 指针 。 

2. 全 局 显示 

在 这 一 方案 中 ， 编 译 器 分 配 一 个 被 称 为 显示 (display) 的 单一 全 局 数组 来 保存 在 每 一 个 词法 层次 上 
的 一 个 过 程 的 最 近 活 动 的 ARP。 对 其 他 过 程 的 局 部 变量 的 所 有 引用 变 成 通过 这 一 显示 的 间接 引用 。 为 了 
存 取 一 个 变量 <n，o>， 编 译 器 使 用 这 一 显示 的 元 素 n 的 ARP。 它 把 o 用 作 偏 移 并 生成 适当 的 装 入 操作 。 
6-10 给 出 这 一 结果 。 
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回 到 存 取 链 的 讨论 中 的 静态 坐标 ， 下 面 的 表 给 出 编译 器 可 能 发 行 的 基于 显示 的 实现 的 代码 。 假 设 当 
前 过 程 处 于 词法 层次 2， 且 标签 -disp 给 出 这 一 显示 的 地 址 。 


loadAI r,,,,24 =r, 
loadI _disp =r, 
loadAI r,,4 =P, 
loadAI r,,12 =r; 
loadI _disp =r; 
loadAI r,,16 =r; 





使 用 显示 ， 非 局 部 存 取 的 代价 是 固定 的 。 使 用 存 取 链 ， 编 译 器 生成 m — "个 装 入 的 序列 ; 使 用 显示 ， 
编译 器 把 n x 1 用 作 显 示 中 的 偏 移 ， 其 中 1 是 指针 的 长 度 (在 这 一 例子 中 l 是 4)。 局 部 存 取 仍然 比 非 局 部 存 
取 廉 价 ， 但 是 使 用 显示 ， 非 局 部 存 取 的 代价 是 常量 ， 而 不 是 变量 。 

当然 ， 编 译 器 必须 插入 维护 这 一 显示 所 需要 的 代码 。 因 此 ， 当 处 于 层次 "的 过 程 p 调 用 某 个 处 于 层次 
n 十 1 的 过 程 q 时 ，p 的 ARP 成 为 层次 n 的 显示 入 口 。(g 正 在 执行 时 这 个 入 口 不 被 使 用 。) 保持 显示 最 新 的 
最 简单 方法 是 当 控制 进入 p 时 ，ip 去 更 新 层次 n 的 入 口 ， 并 在 从 p 离 开 时 恢复 该 入 口 。 在 入 口 处 , p 可 以 
把 层次 上 的 显示 入 口 拷贝 到 p 的 AR 中 保留 的 可 寻 址 性 槽 中 ， 并 把 它 自己 的 ARP 存 储 在 这 一 显示 的 层次 zx 的 
槽 中 。 

当然 ， 可 以 避免 这 些 显示 的 大 多 数 更 新 。 只 有 过 程 P (直接 或 间接 ) 调用 的 过 程 g 可 以 使 用 由 p 存 储 
的 ARP， 其 中 49 负 套 于 p 的 作用 域内 。 因 此 ， 不 调用 被 嵌 套 在 其 自身 中 的 任意 过 程 p 无 需 更 新 这 一 显示 。 
这 消除 叶 过 程 的 所 有 更 新 以 及 其 他 很 多 更 新 。 

3. 两 种 转换 机 制 的 选择 

编译 器 只 能 实现 这 些 技术 中 的 一 个 。 二 者 各 有 优 缺 点 。 

1) 二 者 都 增加 代价 。 显 示 维 护 的 代价 是 常量 ， 即 调用 和 返回 时 的 一 个 装 入 和 存储 。 存 取 链 维护 的 
代价 是 变动 的 ， 但 是 常见 的 层次 "的 过 程 调用 层次 + 1 过 程 的 情况 是 代价 低廉 的 。 

2) 通过 显示 的 引用 有 常量 代价 。 如 果 非 局 部 存 取经 常 发 生 而 成 为 一 个 足够 关注 的 问题 ， 那 么 显示 
指针 可 能 不 能 放 在 它 自己 的 寄存 器 内 。 然 而 在 相同 的 情况 下 ， 它 很 可 能 被 保留 在 缓冲 器 中 ， 从 而 减 小 通 
过 显示 的 间接 寻 址 的 实际 代价 。 

3) 通过 存 取 链 的 引用 导致 变化 的 代价 。 因 为 这 一 链 的 开始 端 被 存储 在 ARP 中 ， 无 需 寄存 器 指向 这 
个 链 。 因 为 编译 器 无 法 控制 AR 是 如 何 映射 到 缓冲 器 的 ， 从 而 人 遍历 这 个 链 可 能 导致 缓冲 错误 。 

在 实践 中 ， 这 两 种 方案 之 间 的 代价 差异 取决 于 对 过 程 调 用 和 返回 的 非 局 部 引用 的 频率 。 

然而 ， 对 于 若干 情况 ， 选 择 是 显然 的 。 例 如 ， 如 果 AR 的 生存 期 可 以 比 创建 它们 的 调用 的 生存 期 长 ， 
那么 存 取 链 仍然 有 效 ， 而 全 局 显示 无 效 。 这 使 存 取 链 成 为 把 过 程 作为 第 一 类 对 象 的 语言 的 共同 选择 。 


6.6 标准 链接 

过 程 链接 是 编译 器 、 操 作 系统 和 目标 机 器 之 间 的 一 种 契约 ， 它 清晰 地 划分 命名 、 资 源 分 配 、 可 寻 址 
性 和 保护 等 责任 。 过 程 链接 保证 用 户 代 码 之 间 的 协同 工作 ， 如 编译 器 翻译 的 代码 ， 包 括 系统 库 、 应 用 库 
和 用 其 他 程序 设计 语言 写成 的 代码 等 从 其 他 资源 而 来 的 代码 之 间 的 协同 工作 。 用 于 给 定 的 目标 机 器 和 操 
作 系 统 的 所 有 编译 器 一 般 都 尽量 使 用 相同 的 过 程 链接 。 

链接 约定 用 于 把 每 一 个 过 程 从 调用 过 程 的 不 同 环境 分 离开 来 。 假 设 过 程 P 有 一 个 整 型 参数 xz。 对 z 的 
不 同调 用 可 能 把 x 绑 定 到 存储 在 调用 过 程 的 栈 框架 中 的 一 个 局 部 变量 上 、 绑 定 到 一 个 全 局 变量 上 、 绑 定 
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到 某 个 静态 数组 的 一 个 元 素 上 或 者 绑 定 到 诸如 y + 2 这 样 的 整 型 表达 式 的 评估 结果 上 。 因 为 过 程 链 接 描述 
如 何在 调用 过 程 中 评估 和 存储 传递 给 xz 的 值 ， 以 及 在 被 调用 过 程 如 何 存 取 这 个 x， 所 以 编译 器 能 够 给 被 调 
用 过 程 本 身 生 成 这 样 的 代码 ， 这 一 代码 忽视 p 的 不 同调 用 的 运行 时 环境 之 间 的 差异 。 只 要 所 有 过 程 都 遵 
循 这 一 链接 约定 ， 这 些 细节 将 联合 起 来 对 由 源 语言 描述 所 允许 的 值 进行 无 颖 传递 。 

当然 , .链接 约定 与 机 器 相关 。 例 如 ， 链 接 约定 隐 式 地 取决 于 诸如 目标 机 器 上 可 用 寄存 器 的 数量 等 信 
息 , 而 且 还 取决 于 执行 调用 和 返回 的 机 制 。 

图 6-11 展 示 标 准 过 程 链 接 的 各 部 分 是 如 何 彼 此 相 适 应 的 。 每 一 个 过 程 都 有 一 个 序言 序列 (prologue 
sequence) 和 一 个 结语 序列 (epilogue sequence)。 和 每 一 个 调用 地 点 包含 一 个 调用 前 序列 (precall 
sequence) 和 一 个 返回 后 序列 (postreturn sequence). 

(1) 调用 前 

调用 前 序列 开始 构造 被 调用 环境 的 过 程 。 它 评估 实 参 、 
决定 返回 地 址 ， 如 果 需 要 的 话 ， 还 决定 用 来 保存 返回 值 的 保 
留 空间 的 地 址 。 如 果 一 个 引用 调用 参数 目前 被 分 配给 一 个 寄 
存 器 ， 那 么 调用 前 序列 需要 把 这 个 参数 存储 到 调用 者 的 AR 
中 ， 使 得 它 可 以 把 这 一 分 配 地 址 传递 给 被 调用 者 。 

如 AR 图 所 示 的 很 多 值 都 可 以 使 用 寄存 器 传递 给 被 调用 
者 。 返 回 地 址 ， 即 返回 值 的 地 址 和 调用 者 的 ARP 显 然 是 这 样 
做 的 候选 者 。 前 x 个 实 参 也 可 以 使 用 寄存 器 传递 ，k 的 典型 值 
是 4。 如 果 调 用 有 多 于 k 个 参数 ， 那 么 剩余 的 实 参 必须 存储 在 
被 调用 者 的 AR 中 或 者 调用 者 的 AR 中 。 

(2) 返回 后 

返回 后 序列 撤销 调用 前 序列 的 动作 。 它 必须 恢复 需要 返回 到 寄存 器 的 引用 调用 及 值 调用 结果 参数 。 
它 必 须 从 寄存 器 存储 区 域 恢 复 所 有 调用 者 保存 的 寄存 器 。 它 也 许 需 要 解除 整个 或 部 分 被 调用 者 的 AR。 

(3) 序言 





图 6-11 标准 过 程 链接 


一 个 过 程 的 序言 序列 完成 构建 被 调用 者 运行 时 环境 的 任务 。 它 可 能 在 被 调用 者 的 AR 中 创建 空间 , 把 


由 调用 者 传递 的 某 些 值 存储 在 寄存 器 中 。 它 必须 为 局 部 变量 创建 空间 ， 如 需要 的 话 ， 还 需要 初始 化 它们 。 
如 果 被 调用 者 引用 过 程 固 有 的 静态 数据 区 ， 那 么 它 也 许 需要 把 这 个 数据 区 的 标签 装 入 到 一 个 寄存 器 中 。 
(4) 结语 
一 个 过 程 的 结语 序列 开始 拆除 被 调用 者 环境 并 重 构 调用 者 环境 的 过 程 。 它 可 能 参与 解除 被 调用 者 


AR 的 工作 。 如 果 这 个 过 程 返回 一 个 值 ， 结 语 可 能 负责 把 这 一 值 存 储 到 由 调用 者 指定 的 地 址 上 。( 也 可 能 


是 由 为 返回 语句 所 生成 的 代码 来 执行 这 一 任务 。) 最 后 ， 它 恢复 调用 者 的 ARP 并 跳 转 到 返回 地 址 。 

这 是 构建 链接 约定 的 一 般 框架 。 其 中 的 很 多 工作 可 以 在 调用 者 和 被 调用 者 之 间 调 整 位 置 。 移 到 序言 
和 结语 序列 一 般 将 产生 更 紧凑 的 代码 。 调 用 前 和 返回 后 序列 是 为 每 一 个 过 程 调用 生成 的 ， 而 序言 和 结语 
序列 对 每 一 个 过 程 只 出 现 一 次 。 如 果 过 程 平均 被 调用 超过 一 次 ， 那 么 序言 和 结语 序列 的 数量 少 于 调用 前 
和 返回 后 序列 的 数目 。 

1. 保存 寄存 器 

必须 在 调用 序列 的 某 个 点 处 把 调用 者 希望 在 调用 后 存活 的 所 有 寄存 器 值 都 保存 在 内 存 中 。 调 用 者 可 
以 执行 这 一 任务 ; 因为 调用 者 精确 地 知道 哪些 值 在 调用 后 仍 需 存活 ， 它 保存 的 寄存 器 数目 也 许 比 被 调 者 
所 保护 的 寄存 器 数目 少 。 这 一 约定 称 为 调用 者 保存 (caller save)。 被 调用 者 也 可 以 执行 这 一 任务 ; 因为 
被 调用 者 精确 地 知道 它 将 要 使 用 哪些 寄存 器 ， 它 可 能 让 某 些 值 保留 在 它们 的 寄存 器 中 而 不 被 接触 。 这 一 
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约定 称 为 被 调用 者 保存 (callee save). 

两 个 约定 都 有 受 欢迎 的 理由 。 存 储 和 恢复 寄存 器 的 过 程 可 能 要 利用 它 自己 的 信息 来 避免 某 些 存储 和 
恢复 。 对 于 任意 的 特定 劳动 分 工 ， 我 们 都 可 以 构造 它 适 用 的 程序 和 它 不 适用 的 程序 。 很 多 现代 系统 采用 
一 个 折 中 的 方案 ， 对 一 部 分 寄存 器 进行 调用 者 保存 处 理 ， 而 对 另外 的 寄存 器 进行 被 调用 者 保存 处 理 。 在 
实践 中 ， 这 似乎 能 很 好 地 工作 。 它 鼓励 编译 器 把 生存 期 长 的 值 放 置 在 被 调用 者 保存 的 寄存 器 中 ， 这 样 它 
们 只 在 被 调用 者 确实 需要 这 个 寄存 器 时 才 被 存储 。 它 鼓励 编译 器 把 生存 期 短 的 值 放 置 在 调用 者 保存 寄存 
器 中 ， 这 样 可 能 在 调用 时 可 以 避免 存储 这 些 值 。 

2. 分 配 活动 记录 

在 大 多 数 一 般 情况 下 ， 调 用 者 和 被 调用 者 都 需要 存 取 被 调用 者 的 AR。 遗 憾 的 是 ， 调 用 者 一 般 都 不 知 
道 构造 多 大 的 被 调用 者 AR (除非 编译 器 和 链接 器 能 够 设法 使 链接 器 把 适当 的 值 粘贴 到 每 一 个 调用 地 点 。) 

使 用 栈 分 配 的 AR 时 ， 有 一 个 折 中 的 方案 。 因 为 分 配 是 由 递增 栈 顶 指针 组 成 的 ， 调 用 者 可 以 通过 跳 
转 到 栈 顶 并 把 值 存储 到 适当 的 位 置 来 开始 创建 被 调用 者 的 AR。 当 控制 传递 到 被 调用 者 时 ， 它 可 能 通过 
进一步 递增 栈 顶 来 部 分 地 扩展 已 构建 的 AR， 从 而 为 局 部 数据 创建 空间 。 在 这 一 方案 中 ， 返 回 后 序列 可 
以 重 置 栈 顶 指针 ， 只 用 一 步 执行 整个 回收 工作 。 

使 用 堆 分 配 的 AR 时 ， 递 增 地 扩展 被 调用 者 的 AR 是 不 可 能 的 。 在 这 种 情况 下 ， 调 用 者 可 以 用 害 存 器 
传递 AR 所 需 的 几乎 所 有 的 值 ; 序言 序列 可 以 分 配 一 个 适当 大 小 的 AR 并 当 需 要 时 把 值 存储 在 其 中 。 当 过 
程 有 过 多 形 参 时 ， 这 一 方案 带 来 一 个 主要 的 复杂 性 问题 。 我 们 所 有 的 图 表 都 展示 存储 在 被 调用 者 AR 中 
的 实 参 ; 使 用 堆 分 配 的 AR ， 调 用 者 可 能 不 能 把 实 参 值 保存 在 那里 。 在 这 一 情况 下 ， 编 译 器 设计 者 可 能 
选择 让 调用 者 把 过 多 的 实 参 存 储 在 自己 的 AR 中 。 这 消除 调用 者 存 取 被 调用 者 的 AR 的 必要 性 ， 并 使 被 调 
用 者 假定 它 全 权 负 责 分 配 和 回收 自己 的 AR。 当 然 ， 存 储 在 调用 者 AR 中 的 参数 的 存 取 的 成 本 会 稍 高 一 些 ， 
因为 当 控 制 在 被 调用 者 中 时 ， 调 用 者 的 ARP 不 总 是 在 寄存 器 中 。 


更 多 关于 时 机 的 问题 | 
| 在 典型 的 系统 中 ， 在 其 发 展 的 早期 阶段 ， 链 接 约定 是 要 经 过 编译 器 实现 者 和 操作 系统 实现 者 之 | 
| 间 协 商 的 。 因 此 ， 诸 如 调用 者 保存 寄存 器 与 被 调用 者 保存 寄存 器 之 间 的 差异 等 问题 都 是 在 设计 时 决 | 


定 的 。 当 编译 器 运行 时 ， 它 必须 为 每 一 个 过 程 发 行 过 程序 言 序列 和 过 程 结语 序列 ， 并 为 每 一 个 调用 | 
地 点 发 行 调 用 前 序列 和 返回 后 序列 。 这 些 代码 在 运行 时 执行 。 因 此 ， 编 译 器 不 知道 应 该 存储 到 被 调 
用 者 AR 的 返回 地 址 。( 一般 也 不 知道 那个 AR 的 地 址 . ) 然而 ， 它 却 可 以 包含 在 链接 时 (使 用 可 重 定 


位 汇编 语言 标签 ) 或 在 运行 时 〈 使 用 距 程序 计数 器 的 某 个 偏 移 ) 生成 返回 地 址 的 机 制 ， 并 把 这 个 返 
回 地 址 存储 在 被 调用 者 AR 中 的 适当 位 置 。 
| 同样 地 ， 在 使 用 显示 为 其 他 过 程 的 局 部 变量 提供 可 寻 址 性 的 系统 中 ， 编 译 器 不 知道 这 一 显示 或 
| AR 的 运行 时 地 址 。 然 而 ， 它 却 可 以 发 行 维护 显示 的 代码 。 实 现 这 一 目标 的 机 制 要 求 两 样 信 息 ， 当 前 | 
过 程 的 词法 幅 套 层次 和 全 局 显示 的 地 址 。 前 者 在 编译 时 可 知 ， 后 者 可 以 通过 使 用 可 重 定位 汇编 语言 | 
| 标签 在 链接 时 确定 下 来 。 因 此 ， 序 言 可 以 读 取 进入 它 的 AR 的 过 程 层次 的 当前 显示 入 口 (根据 显示 地 | 
| 址 使 用 10adA0) 并 把 它 存 储 于 该 AR 中 〈 使 用 相对 于 ARP 的 storeA0 ) 。 





3. 管理 显示 和 存 取 链 
管理 非 局 部 存 取 的 两 个 机 制 都 需要 在 调用 序列 中 做 某 些 工作 。 使 用 显示 ， 序 言 序列 更 新 它 自己 的 层 
次 的 显示 记录 ， 而 结语 序列 则 恢复 显示 记录 。 如 果 过 程 从 不 调用 更 深 的 伐 套 过 程 ， 那 么 它 会 跳 过 这 一 步 。 





it 42 fh R 167 


使 用 存 取 链 ， 调 用 前 序列 必须 定位 被 调用 者 的 第 一 个 存 取 链 。 工 作 量 随 着 调用 者 与 被 调用 者 之 间 在 词法 
层次 上 的 差异 而 变化 。 只 要 被 调用 过 程 在 编译 时 已 知 ， 两 个 方案 都 是 相当 高 效 的 。 如 果 被 调用 者 不 是 已 
知 的 (例如 ， 如 果 它 是 一 个 函数 值 参 数 )， 那 么 编译 器 也 许 需 要 发 行 特殊 分 支 代码 来 执行 适当 的 步骤 。 


6.7 管理 内 存 


编译 器 设计 者 在 实现 过 程 时 必须 面 对 的 另外 一 个 问题 是 内 存 的 管理 。 在 大 多 数 现代 系统 中 ， 每 一 个 
程序 在 它 自身 的 逻辑 地 址 空间 内 执行 。 这 一 地 址 空间 的 布局 、 组 织 和 管理 需要 编译 器 和 操作 系统 之 间 的 
共同 协助 ， 以 便 在 源 语 言 和 目标 机 器 的 规则 和 限制 的 范围 内 提供 高 效 实现 。 


6.7.1 内 存 布局 


编译 器 、 操 作 系统 和 目标 机 器 共同 合作 ， 保 证 多 个 程序 可 以 在 基于 交叉 存 取 (AR) 的 平台 上 安 
全 执行 。 很 多 关于 如 何 布局 、 处 理 和 管理 程序 地 址 空间 的 决策 都 超出 编译 器 设计 者 的 能 力 。 然 而 ， 这 些 
决策 对 必须 生成 的 代码 和 这 一 代码 的 实现 产生 很 大 的 影响 。 因 此 ， 编 译 器 设计 者 必须 对 这 些 问 题 有 广博 
的 理解 。 

1. 设置 运行 时 数据 结构 

在 运行 时 ， 一 个 被 编译 的 程序 是 由 可 执行 代码 和 若干 不 同 的 数据 范畴 组 成 的 。 这 一 被 编译 的 代码 通 
常 是 固定 大 小 的 。 某 些 数 据 区 域 的 大 小 也 是 固定 的 ; 例如 ， 诸 如 FORTRAN 和 C 这 类 的 语言 中 的 全 局 和 
静态 变量 的 数据 区 域 在 执行 期 间 既 不 变 大 也 不 缩小 。 其 他 数据 区 域 在 整个 执行 过 程 中 大 小 是 变化 的 ; 例 
如 ， 保 存 话 动 过程 的 AR 的 区 域 在 程序 执行 时 要 扩大 和 缩小 。 

图 6-12 给 出 一 个 被 编译 程序 所 使 用 的 地 址 空间 的 一 个 典型 布局 。 固 定 大 小 的 可 执行 代码 位 于 地 址 空 
间 的 低 端 ; 在 这 一 图 表 中 被 标 有 静态 (static) 的 相 邻 区 域 保存 静态 和 全 局 数据 区 域 ， 以 及 某 些 编译 器 生 
成 的 数据 。( 依赖 于 程序 和 源 语言 ， 编 译 器 也 可 能 需要 存储 常量 、 开 关 语 名 的 跳 转 表 、 方 法 表 以 及 支持 
垃圾 回收 和 调试 的 信息 。 ) 地 址 空间 的 其 余部 分 都 用 于 伴随 执行 扩展 和 压缩 的 数据 区 域 ; 如 果 语 言 支持 
AR 的 栈 分 配 ， 那 么 编译 器 需要 为 堆 (heap) AIR (stack) 两 者 保留 空间 。 为 了 充分 利用 这 一 空间 ， 堆 和 
栈 应 该 被 放置 在 开放 空间 的 相对 两 端 ， 并 可 以 向 中 间 延 伸 。 堆 向 着 更 高 地 址 延伸 ; 栈 向 较 低地 址 延伸 。 
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图 6-12 逻辑 地 址 空间 布局 


从 编译 器 的 观点 看 ， 逻 辑 地 址 空间 是 整个 图 案 。 然 而 ， 一 般 现代 计算 机 系统 以 一 种 交叉 存 取 形 式 同 
时 执行 很 多 程序 。 操 作 系 统 把 车 干 不 同 的 逻辑 地 址 空间 映射 到 由 目标 机 器 支持 的 单一 地 址 空间 。 图 6-13 
给 出 这 一 个 更 大 的 图 案 。 每 一 个 程序 被 分 隔 在 它 自己 的 逻辑 地 址 空间 内 ; 每 一 个 程序 都 能 如 同 有 自己 的 
机 器 一 样 行动 。 
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图 6-13 地 址 空间 的 不 同 视点 


单一 逻辑 地 址 空间 可 以 跨越 物理 地 址 空间 的 分 开 的 段 (或 页 ) ; 因此 ， 程 序 的 逻辑 地 址 空间 中 的 地 
址 100 000 和 200 000 在 物理 内 存 内 不 一 定 相隔 100 000 字 节 。 事 实 上 ， 与 逻辑 地 址 100 000 相 关联 的 物理 
地 址 可 能 比 与 逻辑 地 址 200 000 相 关联 的 物理 地 址 还 大 。 从 逻辑 地 址 到 物理 地 址 的 映射 是 由 硬件 和 操作 
系统 共同 维护 的 。 在 几乎 各 个 方面 ， 它 都 超出 编译 器 的 视野 。 


2. 内 存 模型 对 代码 形态 的 影响 

编译 器 设计 者 必须 决定 是 把 值 尽 量 保存 在 寄存 器 里 还 是 尽量 保存 在 内 存 里 。 这 一 决策 对 编译 器 为 各 
个 语句 所 发 行 的 代码 有 重要 的 影响 。 

使 用 内 存 到 内 存 模型 ， 编 译 器 在 目标 机 器 上 有 限 的 寄存 器 单元 内 工作 。 编 译 器 所 发 行 的 代码 使 用 真 
实 的 寄存 器 名 字 。 在 语句 到 语句 的 基础 上 ， 编 译 器 保证 对 寄存 器 的 需要 不 超过 目标 机 器 可 用 的 寄存 器 单 
元 数 。 在 这 些 情况 下 ， 寄 存 器 分 配 成 为 改进 代码 的 一 种 优化 ， 而 不 是 正确 性 所 需 的 转换 。 

使 用 寄存 器 到 寄存 器 模型 ， 编 译 器 假设 它 有 一 组 虚拟 寄存 器 ， 而 不 是 目标 机 器 的 真实 寄存 器 单元 。 
这 一 虚拟 寄存 器 单元 大 小 不 限 。 编 译 器 把 可 以 合法 驻 留 在 寄存 器 中 的 每 个 值 与 虚拟 寄存 器 相关 联 ; OR 
有 作为 引用 调用 参数 传送 的 值 、 作 为 返回 值 传送 的 值 以 及 寄存 器 分 配器 造成 溢出 (参见 第 13 章 ) 的 值 才 
被 存储 到 内 存 中 。 使 用 寄存 器 到 寄存 器 内 存 模型 ， 必 须 运 行 寄 存 器 分 配器 来 减少 对 寄存 器 的 需要 ， 并 把 
虚拟 寄存 器 名 字 映 射 到 目标 机 器 寄存 器 名 字 上 。 

3. 调整 和 填充 

目标 机 器 对 数据 项 的 存储 位 置 有 特殊 的 要 求 。 一 组 典型 的 限制 可 以 描述 开始 于 字 (32 位 ) 边界 的 32 
位 整数 和 32 位 浮上 点数， 开始 于 双 字 (64 位 ) 边界 的 64 位 浮 点 数据 ， 以 及 开始 于 半 字 (16 位) 边界 的 串 数 
据 。 我 们 称 这 些 是 调整 规则 (alignment rule), 

一 些 机 器 有 一 个 用 于 实现 过 程 调用 的 特殊 指令 ; 这 一 特殊 指令 可 能 保存 寄存 器 或 存储 返回 地 址 。 这 
样 的 支持 将 进一步 增加 调整 限制 ; 例如 ， 这 一 指令 可 能 指定 AR 的 某 些 部 分 的 格式 ， 并 为 每 个 AR 的 开始 


O 一般 仅 能 用 一 个 名 字 存 取 的 值 可 以 被 保存 在 寄存 器 中 。 我 们 称 这 样 的 值 为 非 餐 义 值 (unambiguous value). 
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点 增加 一 个 调整 规则 。DEC VAX 计 算 机 有 一 个 独特 的 调用 指令 ; 这 一 指令 自动 存储 寄存 器 和 处 理 器 状 
态 的 其 他 部 分 。9 

为 了 遵守 目标 机 器 的 调整 规则 ， 编 译 器 也 许 需 要 浪费 一 些 空间 。 为 了 在 一 个 数据 域内 指定 位 置 ， 编 
译 器 应 该 把 变量 编排 成 组 ， 从 带 有 最 多 的 限制 的 变量 到 带 有 最 少 限制 的 变量 〈 例 如 ， 双 字 调 整 的 限制 比 
全 字 调整 的 限制 更 多 。) 汇编 程序 一 般 有 一 个 保证 装 和 器 开始 于 给 定 调整 的 数据 区 域 ， 例 如 双 字 边界 的 
命令 。 开始 于 这 样 的 边界 ， 编 译 器 能 够 先 给 最 严格 的 范畴 内 的 所 有 变量 赋 偏 移 ， 然 后 给 次 严格 类 内 的 所 
有 变量 赋 偏 移 ， 以 此 类 推 ， 直 到 所 有 变量 都 被 赋 偏 移 为止 。 因 为 调整 规则 几乎 总 是 2 的 者， 每 个 范畴 的 
末端 自然 适合 下 一 个 范畴 的 限制 。 


4. 相对 偏 移 和 高 速 缓冲 存储 器 的 性 能 

在 现代 计算 机 系统 中 高 速 缓 冲 存储 器 的 广泛 使 用 对 内 存 中 变量 的 布局 有 微妙 的 影响 。 如 果 两 个 值 在 
代码 中 的 使 用 很 接近 ， 那 么 编译 器 将 倾向 于 保证 它们 在 同一 时 间 内 驻 留 在 高 速 缓 冲 存储 器 中 。 这 可 以 用 
以 下 两 个 方法 实现 。 


| 高速 缓冲 内 存 基础 
计算 机 “建筑 师 ” 设 法 在 处 理 器 速度 与 内 存 速度 之 间 的 差距 间 搭设 桥梁 的 一 个 方法 是 高 速 比 冲 | 
存储 器 (cache memory) 的 使 用 。 高 速 缓 冲 存储 器 是 置 于 处 理 器 与 主 存储 器 之 间 的 一 个 小 的 高 速 内 | 
| 存 。 高 速 缓冲 存储 器 被 分 成 一 系列 相同 大 小 的 帧 〈frame )。 每 个 帧 有 一 个 地 址 域 ， 称 为 它 的 标签 | 
(tag )， 这 一 地 址 域 保存 主 存储 器 的 地 址 。 
硬件 自动 把 内 存 位 置 映射 到 缓冲 帧 上 。 用 于 直接 映射 的 高 速 缓冲 存储 器 的 最 简单 的 映射 把 高 速 
缓冲 地 址 计算 为 主 存储 器 地 址 模 高 速 缓冲 存储 器 的 大 小 。 这 把 内 存 分 隔 成 一 组 线性 块 ， 每 个 块 的 大 | 
小 是 缓冲 帧 的 大 小 。 一 行 (line) 是 映射 到 一 个 帧 上 的 一 个 内 存 块 。 在 任意 时 刻 ， 每 个 缓冲 帧 保存 | 
一 块 数据 的 一 个 拷贝 。 它 的 标签 域 保 存 数据 所 在 内 存 的 地 址 。 


在 每 一 次 对 内 存 的 读 存 取 中 ， 硬 件 要 查看 被 请 求 的 字 是 否 已 在 它 的 缓冲 帧 里 。 如 果 是 这 样 的 话 ， 


| 被 请 求 的 这 些 字 池 返回 到 处 理 器 中 。 否 则 ， 在 这 一 帧 中 的 块 被 驱除 ， 同 时 被 请 求 的 块 被 带 人 到 这 一 | 
缓冲 存储 器 中 。 
有 些 高 速 缓冲 存储 器 使 用 更 复杂 的 映射 。 集 合 关联 (set-associative) 高 速 缓冲 存储 器 对 每 个 缓 | 
| 冲 行使 用 多 个 帧 ， 每 一 个 行 一 般 使 用 两 到 四 个 帧 。 完整 关 联 (fully associative) 缓冲 存储 器 可 以 把 | 
任意 一 个 块 放 置 到 任意 帧 中 。 这 些 方案 都 使 用 标签 上 的 关联 搜索 来 确定 一 个 块 是 否 在 这 一 缓冲 器 内 。 | 
| 关联 方案 使 用 一 种 策略 来 确定 要 驱除 哪个 块 ， 常 见 的 方案 是 随机 置换 和 最 近 最 少 使 用 (least- | 
| recently-used, LRU) 置换 。 . 

在 实践 中 ， 高 效 的 内 存 速度 是 由 内 存 带 宽 、 缓 冲 块 长 度 、 高 速 缓 冲 的 速度 与 内 存 速度 的 比率 和 | 
| 组 冲 器 内 的 存 取 击 中 率 决定 的 。 从 编译 器 的 角度 看 ， 前 三 个 是 固定 的 。 以 编译 器 为 基础 的 对 改进 内 | 
存 性 能 的 努力 集中 在 增加 击 中 率 。 | 

一 些 体系 结构 提供 一 些 指令 ， 这 些 指令 允许 程序 给 高 速 缓冲 提供 线索 : 什么 时 候 特定 块 应 被 放 入 | 
内 存 中 〈 预 取 )， 什 么 时 候 它们 不 再 被 需要 (清洗 )。 | 

最 好 的 情况 是 这 两 个 值 共享 一 个 缓冲 块 ， 这 保证 可 以 一 起 将 这 两 个 值 从 内 存 提取 到 缓冲 器 中 。 如 果 
它们 不 能 共享 一 个 缓冲 块 ， 那 么 编译 器 将 倾向 于 保证 这 两 个 值 映 射 到 不 同 的 缓冲 行 。 通 过 控制 这 两 个 值 


O ”对 于 每 一 个 过 程 ， 编 译 器 决定 必须 保存 哪些 寄存 器 和 状态 位 。 编 译 器 把 这 一 信息 编码 到 一 个 位 掩 码 并 存储 
于 在 过 程序 言 的 前 面 。 过 程 调用 指令 重新 得 到 这 个 掩 码 并 解释 它 ， 从 而 保存 指定 的 寄存 器 和 状态 位 。 
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的 地 址 间 的 距离 ， 编 译 器 可 以 做 到 这 一 点 。 

如 果 我 们 只 考虑 两 个 变量 ,控制 它们 地 址 之 间 的 距离 似乎 容易 处 理 。 然 而 ， 当 考虑 所 有 活动 变量 时 ， 
缓冲 器 的 最 优化 布局 问题 是 NP 完全 的 。 大 多 数 变量 都 与 其 他 变量 有 交互 作用 ; 这 创建 一 个 编译 器 无 法 
同时 满足 的 关系 网 络 。 如 果 我 们 考虑 使 用 若干 大 数组 的 循环 ， 解 决 互 不 干涉 问题 甚至 会 变 得 更 糟 。 如 果 
编译 器 能 够 发 现 这 一 循环 中 不 同 数组 引用 之 间 的 关系 ， 那 么 编译 器 可 以 在 数组 之 间 增 加 填充 来 增加 引用 
击 中 不 同 缓冲 行 的 可 能 性 ， 因 此 也 就 不 互相 和 干涉。 

正如 我 们 在 前 面 所 看 到 的 那样 ， 程 序 的 逻辑 地 址 空间 到 硬件 的 物理 地 址 空间 的 映射 不 一 定 保持 特定 
变量 之 间 的 距离 。 作 为 这 一 想法 的 逻辑 结论 ， 读 者 也 许 会 问 编译 器 是 如 何 保证 与 超出 虚拟 内 存 页 的 大 小 
的 相对 偏 移 相关 的 所 有 事情 的 。 处 理 器 的 物理 高 速 缓冲 器 既 可 能 使 用 虚设 地 址 又 可 能 使 用 它 的 标签 域 中 
的 物理 地 址 。 虚 拟 地 址 高 速 缓 冲 器 保持 编译 器 创建 的 值 之 间 的 空间 ; 使 用 这 样 的 高 速 缓冲 器 ， 编 译 器 也 
许 能 够 设法 使 较 大 对 象 之 间 互 不 干涉 。 使 用 物理 地 址 高 速 缓冲 器 ， 不 同 页 中 的 两 个 位 置 之 间 的 距离 是 由 
页 映射 决定 的 《除非 高 速 缓 冲 器 的 大 小 不 超过 页 的 大 小 )。 因 此 ， 编 译 器 有 关内 存 布 局 的 决策 很 少 产生 
效应 ， 除 非 它们 是 在 一 个 页 内 。 在 这 样 的 情况 下 ， 编 译 器 应 该 致力 于 使 一 起 被 引用 的 对 象 在 相同 页 上 ， 
而 且 如 有 可 能 ， 使 它们 在 相同 的 高 速 缓冲 块 中 。 


6.7.2 堆 管 理 算法 


很 多 程序 设计 语言 处 理 动态 创建 和 销毁 的 对 象 。 编 译 器 通常 不 能 决定 这 样 的 对 象 的 大 小 和 生存 期 。 
为 了 处 理 这 样 的 对 象 ， 编 译 器 和 操作 系统 创建 一 个 动态 可 分 配 存储 地 ， 这 一 存储 池 一 般 被 称 为 运行 时 堆 
(run-time heap) 或 堆 。 在 维 的 创建 和 管理 中 出 现 很 多 问题 ; 其 中 一 些 问 题 能 够 被 源 语言 程序 员 观 察 到 ， 
而 另外 一 些 问 题 只 有 系统 软件 的 设计 者 才能 够 观察 到 。 

本 节 主 要 揭示 用 于 堆 管理 的 一 些 算法 。 本 节 考 虑 一 个 显 式 可 管理 堆 的 情况 ， 在 这 一 情况 中 ， 程 序 员 
必须 分 配 并 释放 空间 。 下 一 节 考 虑 执行 隐 式 释放 的 算法 。 l 

我 们 假设 堆 有 简单 的 接口 ， 即 例 程 a1 locate(size) 和 free(address)。allocate 例 程 取 整数 参数 
size 并 返回 包含 至 少 size 字 节 的 堆 中 的 一 个 空间 块 的 地 址 。free 例 程 取 堆 中 在 前 面 所 分 配 的 空间 块 的 地 
址 ， 并 把 这 一 地 址 返回 到 自由 空间 地 。 

显 式 堆 管理 的 算法 设计 中 所 引发 的 关键 问题 是 a110cate 和 free 的 速度 以 及 自由 空间 池 破 碎 成 小 块 的 
程度 。 我 们 首先 考虑 简单 的 分 配 模型 : 首次 拟 合 分 配 (first-fit allocation), 

1. 首次 拟 合 分 配 

首次 拟 合 分 配器 的 目标 是 快速 分 配 和 释放 堆 中 的 空间 。 首次 拟 合 方案 强调 的 不 是 内 存 利 用 而 是 速度 。 
堆 中 的 每 一 个 块 都 有 一 个 保存 其 大 小 的 隐藏 域 ， 作 为 矫 记 的 负荷 。 容 量 字段 一 般 被 定位 于 a110cate 返 回 
的 地 址 的 前 面 的 字 中 。 可 分 配 块 居于 称 为 自由 列表 (free list) 的 列表 中 。 在 必需 的 容量 字段 之 外 ， 自 由 
列表 中 的 每 个 块 有 指向 自由 列表 中 下 一 个 块 的 指针 (或 在 最 后 一 个 块 的 空 指针 ) 和 位 于 这 个 块 的 最 后 字 
中 的 指向 这 个 块 本 身 的 指针 。 


| | 
awa [zæ] o 
next 


堆 的 初始 条 件 是 被 置 放 在 自由 列表 中 的 一 个 大 块 ， 以 及 包含 指向 这 个 块 的 开始 的 最 后 字 和 一 个 空 的 next 域 。 
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调用 al11ocate(K) 引 发 下 面 一 系列 事件 。a11ocate 例 程 遍历 自由 列表 直到 它 发 现 一 个 大 小 大 于 或 等 
于 k 加 上 size 域 的 一 个 字 的 大 小 的 块 。 假 设 a11ocate 发 现 一 个 适当 的 块 b;。 它 把 bj; 从 自由 列表 中 移出 。 如 
果 b, 比 需要 的 大 ， 那 么 a11ocate 在 5b 的 未 端 剩余 空 间 中 创建 一 个 新 的 自由 块 ， 并 且 把 这 一 新 的 自由 块 放 
置 在 自由 列表 中 。altocate 例 程 返回 一 个 指向 2 第 二 个 字 的 指针 。 

如 果 al1ocate 没 有 发 现 足够 大 的 块 ， 那 么 它 尝 试 着 扩充 这 个 堆 。 如 果 它 成 功 地 扩充 了 堆 ， 那 么 它 从 这 
个 堆 新 分 配 的 部 分 返回 适当 大 小 的 块 。 如 果 扩 充 堆 失败 ， 那 么 它 报告 错误 (一般 通过 返回 一 个 空 指针 )。 

为 了 释放 一 个 块 ， 程 序 对 这 个 块 b 的 地 址 调用 free。free 最 简单 的 实现 是 把 bp 加 到 自由 列表 的 头 部 并 
返回 。 这 生成 一 个 快速 的 free 例 程 。 遗 憾 的 是 ， 这 一 做 法 导致 在 反复 使 用 中 把 内 存 分 成 小 块 的 分 配器 。 

为 了 克服 这 一 缺点 ， 分 配器 可 以 在 自由 块 的 末端 使 用 一 个 指针 来 连结 邻接 的 自由 块 。free 例 程 装 入 
5b 的 容量 字段 前 面 的 字 ， 这 个 字 是 内 存 中 4b 的 直接 前 驱 块 的 块 尾 指 针 。 如 果 这 个 字 包 含 一 个 有 效 指针 ， 
而 它 指出 一 个 匹配 的 块 的 首部 (其 地 址 加 上 容量 字段 指向 bj 的 开始 的 块 )， 那 么 b 和 它 的 前 驱 都 是 自由 的 。 
free 例 程 可 以 通过 增加 前 驱 的 容量 字段 并 在 b 的 最 后 字 中 存储 适当 指针 来 把 二 者 组 合 起 来 。 把 新 的 块 连 
结 到 它 的 前 驱 上 从 而 避免 更 新 自由 列表 。 

为 了 使 这 一 方案 运作 起 来 ，al11ocate 和 free 必 须 维护 块 尾 指针 。 每 当 free 处 理 一 个 块 时 ， 它 必须 
用 这 一 块 的 头 部 地 址 更 新 块 尾 指 针 。a11ocate 例 程 必须 或 者 使 next 指 针 无 效 ， 或 者 使 块 结束 指针 无 效 ， 
这 样 来 阻止 free 把 自由 块 与 已 分 配 块 组 合 起 来 ， 这 样 的 已 分 配 块 的 这 些 域 没有 被 复写 。 

free 例 程 也 可 尝试 把 bj 与 内 存 中 它 的 后 继 b 组 合 起 来 。free 可 以 使 用 b, 的 容量 字段 来 定位 bi 的 开始 。 
它 还 可 以 使 用 b4 的 容量 字段 和 块 尾 指针 确定 bi 是 否 是 自由 的 。 如 果 b 是 自由 的 ， 那 么 free 可 以 把 这 两 个 
块 组 合 起 来 ， 从 自由 列表 中 移出 Bb 且 把 bj 加 入 自由 列表 中 。 为 了 使 这 一 自由 列表 的 更 新 高 效 ， 自 由 列表 
需要 双重 链接 。 因 为 ， 指 针 被 存储 在 未 分 配 块 中 ， 所 以 空间 负荷 是 无 关 紧 要 的 。 更 新 双重 链接 自由 列表 
所 需要 的 额外 的 时 间 很 小 。 

如 上 所 述 ， 这 一 组 合 方案 依赖 于 这 样 的 事实 : 自由 块 中 的 最 后 的 指针 与 容量 字段 之 间 的 关系 在 已 分 
配 块 中 不 复 存 在 。 尽 管 分 配器 几乎 是 不 可 能 把 一 个 已 分 配 块 看 成 是 自由 的 ， 但 是 这 还 是 可 能 发 生 的 。 为 
了 防止 这 一 未 必 发 生 的 事件 出 现 , 实现 者 可 以 使 块 尾 指针 既 存 在 于 已 分 配 块 又 存在 于 自由 块 的 一 个 域 中 。 
在 分 配 时 ， 这 一 指针 设置 为 堆 外 面 的 一 个 地 址 ， 例 如 0。 在 释放 时 ， 这 一 指针 被 设置 成 这 个 块 本 身 的 地 
址 。 这 一 附加 保障 的 代价 是 在 每 一 个 已 分 配 块 中 有 一 个 额外 的 域 ， 且 对 每 一 次 分 配 有 一 个 额外 的 存储 。 

大 们 尝试 了 许多 首次 拟 合 分 配 的 变形 。 这 些 尝试 在 a11ocate 的 代价 、free 的 代价 、 由 一 系列 分 配 所 
产生 的 碎片 总 量 和 返回 比 需要 更 大 的 空间 所 浪费 的 空间 总 量 之 间 进 行 权 衡 。 


| 基于 实 存 块 的 分 本 
| 在 编译 器 内 部 ， 编 译 器 设计 者 也 许 发 现 使 用 一 个 特 化 了 的 分 配器 是 可 行 的 。 编 译 器 有 面向 阶段 | 
| 的 活动 。 这 非常 适合 于 基于 实 存 块 的 分 配方 案 。 i 


使 用 基于 实 存 块 的 分 配器 ， 程 序 将 在 一 个 活动 开始 时 创建 一 个 实 存 块 。 这 一 程序 使 用 这 个 实 存 | 
| 块 保存 在 使 用 上 相关 的 已 分 配对 象 。 在 实 存 块 中 的 分 配对 象 的 调用 满足 栈 风格 ; 一 个 分 配 包含 递增 | 


指向 实 存 块 高 水 标的 指针 并 返回 指向 新 已 分 配 块 的 指针 。 没 有 用 于 释放 各 个 对 象 的 调用 ; 当 包 含 这 | 
些 对 象 的 实 存 块 被 释放 时 ， 这 些 对 象 被 释放 。 . 

基于 实 存 块 的 分 配器 是 传统 的 分 配器 和 垃圾 回收 分 配器 之 间 的 一 种 折 中 。 使 用 基于 实 存 块 的 分 
配器 ， 对 allocate 的 调用 变 得 无 足 轻重 〈 正 如 在 现代 分 配器 中 那样 ) 。 不 需要 释放 调用 ; 当 程 序 完 | 
成 创建 实 存 块 的 活动 时 ， 程 序 在 一 个 调用 下 释放 整个 实 存 块 。 
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2. 多 池 分 配器 

现代 分 配器 使 用 一 种 简单 的 技术 ， 它 得 自 于 首次 拟 合 分 配 ， 及 一 组 关于 程序 行为 的 观察 。 随 着 20 世 
纪 80 年 代 早期 的 内 存 增长 ， 如 果 浪 费 一 些 空间 可 以 加 快 分 配 ， 那 么 这 样 做 也 变 得 合理 。 同 时 对 程序 行为 
的 研究 表明 ， 实 际 的 程序 频繁 地 分 配 若 干 标准 大 小 的 内 存 ， 而 不 常 分 配 大 内 存 ， 也 不 常 分 配 不 常见 大 小 
的 内 存 。 

现代 分 配器 对 若干 标准 尺寸 使 用 独立 的 内 存 池 。 所 选 的 大 小 一 般 是 2 的 宕 ， 从 小 的 块 尺寸 〈 例 如 16 字 
节 ) 到 虚拟 内 存 页 的 尺寸 (一 般 是 4096 字 节 或 8192 字 节 )。 每 个 字 仅 有 一 种 块 尺 寸 ， 所 以 a11ocate 可 以 返 
回 适当 自由 列表 的 第 一 个 块 ， 而 free 可 以 单纯 地 把 块 加 到 这 个 适当 自由 列表 的 头 部 。 对 于 大 于 页 尺寸 的 
要 求 使 用 独立 的 首次 拟 合 分 配器 。 基 于 这 些 思想 的 分 配器 很 快 。 这 些 分 配器 特别 适用 活动 记录 的 堆 分 配 。 

这 些 改变 简化 a11ocate 和 free。al1ocate 例 程 必须 对 空 的 自由 列表 进行 检查 ， 并 且 当 它 为 空 时 对 
相应 的 池 增 加 一 个 页 。free 例 程 仅 把 块 插入 相应 尺寸 的 自由 列表 的 头 部 。 通 过 对 照 为 每 一 个 池 所 分 配 的 
内 存 区 间 检 查 自 由 块 的 地 址 巧妙 的 实现 可 以 确定 这 一 自由 块 的 尺寸 。 另 一 个 方案 就 是 同 前 面 一 样 使 用 容 
量 字 段 ， 并 且 如 果 分 配器 把 一 个 页 上 的 所 有 存储 都 放 人 到 一 个 了 池内， 那么 就 把 一 个 页 中 的 块 的 尺寸 存储 
在 这 个 页 的 第 一 个 字 里 。 

3. 调试 帮助 

使 用 显 式 分 配 和 释放 编写 的 程序 非常 不 容易 调试 。 这 表现 为 程序 员 很 难 决定 什么 时 候 释 放 堆 分 配 的 


.对象 。 如 果 分 配器 能 够 很 快 地 区 分 已 分 配对 象 各 自由 对 象 的 话 ， 那 么 堆 管理 软件 可 以 为 程序 员 的 调试 提 


供 某 些 帮 助 。 

例如 ， 为 了 组 合 相 邻 的 自由 块 ， 分 配器 需要 一 个 从 一 个 块 的 尾 端 回 到 它 的 头 部 的 指针 。 如 果 一 个 已 
分 配 块 使 这 个 指针 设置 到 一 个 无 效 值 ， 那 么 释放 例 程 可 以 检查 这 个 域 ， 并 当 程序 试图 释放 自由 块 或 一 个 
非法 地 址 时 ， 即 指向 某 个 已 分 配 块 的 开始 之 外 的 其 他 任意 事物 时 ， 释 放 例 程 报告 一 个 运行 时 错误 。 

在 适度 的 附加 代价 下 ， 堆 管理 软件 可 以 提供 额外 的 帮助 。 通 过 把 已 分 配 块 链接 到 一 起 ,分 配器 可 以 
创建 一 个 内 存 分 配 调试 环境 。 快 照 工具 可 以 漫游 已 分 配 块 列表 。 通 过 使 用 创建 块 的 调用 地 点 为 这 些 块 附 
标签 使 得 这 一 工具 可 以 揭示 出 内 存 泄漏 。 给 已 分 配 块 打上 时 间 印 可 以 为 程序 员 提 供 关 于 内 存 使 用 的 详细 
信息 。 这 种 类 型 的 工具 可 以 对 定位 从 不 释放 的 块 提供 很 大 的 帮助 。 


6.7.3 隐 式 释放 


很 多 程序 设计 语言 允许 实现 在 内 存 对 象 不 再 使 用 时 自动 释放 它们 。 这 要 求 对 分 配器 和 编译 代码 的 实 
现 格外 小 心 。 为 了 执行 隐 式 释放 ， 即 垃圾 回收 (garbage collection ) ， 编 译 器 和 运行 时 系统 必须 包含 确定 
什么 时 候 一 个 对 象 不 再 有 用 或 已 经 死亡 的 机 制 ， 还 必须 包含 回收 和 再 利用 死亡 空间 的 机 制 。 

垃圾 回收 的 相关 工作 可 以 递增 地 施加 于 各 个 语句 ， 也 可 以 当 自 由 空间 池 耗 尽 时 由 按 面向 批 处 理 的 任 
务 要求 来 实施 。 引 用 计数 (reference counting) 是 执行 递增 垃圾 回收 的 一 个 经 典 方 法 。 标 记 清 理 回收 
(mark-sweep collection) 则 是 执行 面向 批 处 理 回 收 的 经 典 方法 。 


1. 引用 计数 

这 一 技术 给 每 一 个 堆 分 配对 象 增设 一 个 计数 器 。 计 数 器 追踪 引用 该 对 象 的 未 完结 指针 的 数目 。 当 分 
配器 创建 该 对 象 时 ， 它 将 其 引用 计数 设置 为 !。 对 一 个 指针 变量 的 每 一 次 赋值 都 调整 两 个 引用 计数 。 它 
递减 指针 的 赋值 前 的 值 的 引用 计数 ， 而 递增 指针 的 赋值 后 的 值 的 引用 计数 。 当 一 个 对 象 的 引用 计数 降 到 
0 时 ， 不 存在 指向 这 一 对 象 的 指针 ， 所 以 系统 可 以 安全 地 释放 这 一 对 象 。 释 放 一 个 对 象 也 许 又 会 废弃 指 
向 其 他 对 象 的 指针 。 这 必定 递减 那些 对 象 的 引用 计数 。 因 此 ， 废 弈 指向 一 个 抽象 语法 树 的 最 后 的 指针 将 
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释放 整 棵 树 。 当 根 结 点 的 引用 计数 降 到 0 时 ， 它 被 释放 且 它 的 子孙 的 引用 计数 也 被 减少 。 因 此 ， 这 将 释 
放 这 些 子 孙 ， 减 少 它们 的 子 结 点 的 引用 计数 。 这 一 过 程 一 直 继续 下 去 直到 整个 AST 被 释放 。 

由 于 在 已 分 配对 象 中 存在 指针 ， 这 给 引用 计数 方案 带 来 如 下 所 示 的 若干 问题 : 

1) 运行 代码 需要 区 分 指针 与 其 他 数据 的 机 制 。 这 一 机 制 或 者 为 每 一 个 对 象 把 额外 的 信息 存储 于 它 
的 头 部 域 ， 或 者 把 指针 限定 到 小 于 一 个 全 字 的 范围 ， 并 使 用 空余 的 位 “标签 ”这 一 指针 。 批 处 理 回收 器 
也 面 对 着 同样 的 问题 ， 而 且 使 用 相同 的 解决 方案 。 

2) 每 次 减 小 引用 计数 所 做 的 工作 量 可 能 相当 大 。 如 果 外 部 限制 要 求 有 界 的 释放 时 间 ， 那 么 运行 时 
系统 可 以 采用 更 复杂 的 协议 来 限制 为 每 一 个 指针 赋值 时 释放 的 对 象 的 数量 。 通 过 维护 必须 释放 对 象 的 队 
列 ， 并 限制 对 每 一 次 引用 计数 调整 所 做 的 处 理 数量 ， 运 行 时 系统 可 以 在 较 大 的 操作 集合 上 分 布 释放 对 象 
的 工作 。 这 把 所 有 赋值 的 集合 上 的 释放 代价 摊派 到 堆 分 配对 象 上 ， 并 限制 每 一 次 赋值 时 所 做 的 工作 。 

3) 程序 可 能 形成 指针 的 有 环 图 。 有 环 数 据 结构 的 引用 计数 不 能 减 小 到 0。 当 最 后 的 外 部 指针 被 废弃 
后 ， 这 一 环 变 得 不 可 达 且 不 可 再 利用 。 为 了 保证 释放 这 样 的 对 象 ， 程 序 员 必 须 在 废弃 指向 环 的 最 后 指针 
之 前 切断 这 一 环 。( 另 外 一 个 选择 是 在 运行 时 对 这 些 指针 执行 可 达 性 分 析 ， 这 将 使 引用 计数 的 代价 过 于 
Hit.) 很 多 堆 分 配对 象 的 范畴 ， 如 可 变 长 度 串 和 活动 记录 等 都 不 能 包含 这 样 的 环 。 

引用 计数 在 每 一 个 指针 赋值 上 带 来 额外 的 代价 。 可 以 限制 为 特定 赋值 所 做 的 工作 量 ; 在 任意 良好 的 
设计 中 ， 总 代价 可 以 被 限制 到 某 个 常量 因子 乘 以 被 执行 的 指针 赋值 数量 ， 加 上 分 配对 象 的 数量 。 引 用 计 
数 的 支持 者 们 认为 这 些 负荷 是 足够 小 的 ， 而 且 认 为 引用 计数 体系 中 的 复 用 模式 产生 良好 的 程序 局 部 性 。 
引用 计数 的 反对 者 们 认为 实际 程序 比分 配 要 做 更 多 的 赋值 ， 因 此 垃圾 回收 对 较 少 的 工作 总 量 要 做 较 多 的 
工作 。 

2. 批 回收 器 

仅 当 自由 空间 池 被 耗 尽 时 ， 批 回收 器 才 考 虑 释放 。 当 分 配器 找 不 到 所 需要 的 空间 时 ， 它 调用 批 回收 
器 。 回 收 器 中 止 程序 的 执行 ， 检 查 已 分 配 内 存 池 来 发 现 不 被 使 用 的 对 象 并 回收 这 些 对 象 的 空间 。 当 回收 
器 终止 时 ， 自 由 空间 池 是 非 空 的 。 旨 分 配器 可 以 完成 它 本 身 的 工作 并 把 新 分 配 的 对 象 返 回 给 调用 者 。 
(在 同 引用 计数 一 样 ， 可 以 执行 增 量 回收 把 代价 摊派 到 更 长 的 执行 期 间 。) 

批 回 收 器 逻辑 上 有 两 个 阶段 。 第 一 个 阶段 发 现 如 下 这 样 的 一 组 对 象 : 从 存储 于 程序 变量 中 的 指针 和 
编译 器 生成 的 临时 变量 可 达 的 对 象 。 回 收 器 适宜 地 假设 以 这 种 方式 可 达 的 任意 对 象 是 活 的 ， 而 其 余 对 象 
是 死 的 。 第 二 个 阶段 释放 并 再 利用 死 对 象 。 两 个 常用 的 技术 是 标记 清理 (mark-sweep) 回收 器 和 复制 
(copying) 回收 器 。 它 们 的 差异 在 于 回收 的 第 二 个 阶段 ， 即 再 利用 的 实现 不 同 。 

3. 识别 活 数 据 

回收 分 配器 通过 使 用 标记 算法 发 现 活 对 象 。 对 堆 中 的 每 一 个 对 象 回收 器 需要 一 位 ， 称 为 标记 位 
(mark bit)。 这 个 位 和 用 于 记录 指针 位 置 或 对 象 大 小 信息 的 标签 信息 一 同 存储 在 对 象 的 头 部 。 另 外 ， 必 
要 时 回收 器 也 可 以 为 堆 创建 一 个 稠密 的 位 映射 。 这 一 算法 的 第 一 步 清除 所 有 标记 位 并 构建 一 个 工作 表 
(worklist)， 所 有 工作 表 包 含 存储 于 寄存 器 的 指针 及 对 应 于 当前 或 等 待 过 程 的 活动 记录 中 的 指针 。 这 一 
算法 的 第 二 个 阶段 从 这 些 指针 开始 向 前 遍历 ， 并 标记 出 从 这 一 组 可 见 指 针 可 达 的 每 一 个 对 象 。 

图 6-14 展 示 标 记 算 法 的 一 个 高 级 概略 。 这 是 一 个 简单 的 不 动 点 计算 ， 因 为 堆 是 有 限 的 而 且 标记 阻止 
堆 内 的 指针 多 次 进入 工作 表 (Work7ist)， 因 此 算法 终止 。 在 最 坏 的 情况 下 ， 标 记 的 代价 与 包含 在 程序 
变量 中 的 指针 和 临时 变量 数目 加 上 堆 的 大 小 成 正比 。 


© 除非 所 有 空间 都 已 被 使 用 。 在 这 样 的 情况 下 ， 分 配器 设法 从 操作 系统 得 到 额外 的 空间 ， 它 把 这 一 空间 用 作 
自由 空间 池 。 如 果 没 有 可 用 的 额外 的 空间 ， 分 配 失败 。 
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清理 所 有 标记 
Worklist + { pointer values from activation records & registers } 
while (Worklist # 0) 


remove p from the Worklist 
if (pobject is unmarked) 
mark pP 一 Object 
add pointers from p—object to Worklist 





图 6-14 一 个 简单 的 标记 算法 


标记 算法 既 可 以 是 精确 的 ， 又 可 以 是 保守 的 。 其 差异 在 于 算法 如 何 确定 while 循 环 的 最 后 一 行 中 的 
特定 数据 值 是 指针 。 l 
E 在 精确 回收 器 中 ， 编 译 器 和 运行 系统 了 解 每 一 个 对 象 的 类 型 和 布局 。 这 一 信息 可 以 记录 在 对 象 的 
头 部 ， 或 者 可 以 从 类 型 系统 间接 地 得 知 这 一 信息 。 无 论 是 哪 一 种 方法 ， 使 用 精确 的 知识 ， 标 记 阶 
段 只 跟踪 实际 的 指针 。 
E 在 保守 的 标记 阶段 ， 编 译 器 和 运行 时 系统 不 能 肯定 某 些 对 象 的 类 型 和 布局 。 因 此 ， 当 一 个 对 象 被 
标记 时 ， 运 行 时 系统 考虑 可 能 是 指针 的 每 一 个 域 。 如 果 它 的 值 是 一 个 指针 ， 那 么 它 就 被 当 作 指针 . 
处 理 。 不 表示 字 对 准 地 址 的 任意 值 都 排除 在 外 ， 因 为 它 可 能 是 落 于 堆 的 已 知 界线 外 面 的 值 。 
保守 分 配器 具有 局 限 性 。 它 们 无 法 回收 精确 回收 器 能 够 发 现 的 某 些 对 象 。 如 果 程 序 可 以 隐藏 一 个 指 
针 使 标记 阶段 找 不 到 它 ， 那 么 这 一 回收 器 可 能 不 正确 地 释放 已 分 配 的 对 象 。 但 是 ， 经 过 成 功 的 改进 ， 保 
守 回 收 器 已 经 被 实现 于 诸如 C 语 言 等 通常 不 支持 垃圾 回收 的 语言 
当 标记 算法 停止 时 ， 任 何 没 有 被 标记 的 对 象 一 定 是 程序 无 法 达到 的 对 象 。 因 此 ， 回 收 器 的 第 二 个 阶 
段 可 以 把 这 样 的 对 象 作为 死 对 象 处 理 。 某 些 被 标记 为 活 对 象 也 可 能 是 死 的 。 然 而 ， 回 收 器 让 它们 活着 ， 
因为 回收 器 无 法 证 明 它们 是 死 的 。 当 第 二 个 阶段 遍历 堆 来 回收 垃圾 时 ， 它 可 以 把 标记 域 重 新 设置 为 “不 
被 标记 ” 。 这 使 得 回收 器 避免 在 标记 阶段 对 堆 的 初始 遍历 。 
4. 标记 清理 回收 器 
标记 清理 《mark-sweep) 回收 器 通过 对 堆 进 行 线性 扫描 回收 和 再 利用 对 象 。 回 收 器 把 每 一 未 被 标记 
对 象 加 到 自由 列表 中 (或 多 个 自由 列表 中 的 一 个 列表 中 )， 在 这 里 分 配器 可 以 找到 这 个 对 象 并 复 用 它 。 
使 用 一 个 自由 列表 时 ， 可 以 运用 首次 拟 合 分 配器 中 用 于 组 合 块 的 技术 。 如 果 希 望 压缩 ， 那 么 通过 在 清理 
期 间 递增 地 向 下 移动 活 对 象 来 实现 压缩 ， 也 可 以 在 清理 后 使 用 一 个 压缩 遍 来 实现 压缩 。 
5. 拷贝 回收 器 
拷贝 回收 器 把 内 存 分 成 两 个 地 ， 一 个 日 (old) 池 和 一 个 新 (new) 池 。 分 配器 总 是 从 旧 池 开始 操作 。 
拷贝 回收 器 的 最 简单 类 型 称 为 停机 拷贝 (stop and copy) 回收 器 。 当 一 次 分 配 失 败 时 ， 停 机 拷贝 回收 器 
把 所 有 活 数据 从 旧 池 拷贝 到 新 池 中 ， 并 交换 新 旧 池 的 身份 。 找 贝 活 数 据 的 动作 压缩 这 一 数据 ; 回收 后 ， 
整个 自由 空间 在 单一 的 连续 块 中 。 回 收 进行 两 个 阶段 的 工作 ， 与 标记 清除 一 样 ， 它 也 可 以 在 发 现 活 数据 
时 增 量 地 进行 回收 。 一 个 增 量 方案 是 在 拷贝 旧 池 对 象 时 对 其 做 标记 以 避免 把 同一 个 对 象 拷 贝多 次 。 
拷贝 回收 器 的 一 个 重要 的 系列 是 世代 回收 器 (generational collector)。 这 些 回 收 器 利用 这 样 的 观察 : 
在 一 次 回收 中 活着 的 对 象 很 可 能 在 后 续 很 多 回收 中 仍然 活着 。 为 了 利用 这 一 观察 ， 世 代 回收 器 通过 重新 
分 割 新 、 旧 池 中 的 自由 空间 使 得 后 继 回收 只 检查 新 的 已 分 配对 象 。 不 同 的 世代 方案 在 声明 新 的 世代 、 冻 
结 活着 的 对 象 以 免除 下 一 次 回收 ， 以 及 是 否 要 周期 性 地 再 检查 较 旧 世代 等 工作 的 时 机 上 存在 差异 。 
6. 各 技术 的 比较 
垃圾 回收 把 程序 员 从 对 什么 时 候 释放 内 存 的 担忧 中 解放 出 来 ， 把 他 们 从 由 于 显 式 地 管理 分 配 和 释放 
的 工作 所 产生 的 不 可 避免 的 存储 泄漏 的 跟踪 中 解放 出 来 。 各 个 方案 都 有 它们 的 优点 和 缺点 。 对 于 大 多 数 
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运用 来 说 ， 在 实践 中 隐 式 释放 各 个 方案 的 益处 都 超过 任何 方案 的 缺点 。 

引用 计数 比 批 回收 更 均匀 地 摊派 回收 代价 于 整个 程序 执行 期 间 。 然 而 ， 即 使 程序 从 不 用 尽 自 由 空间 ， 
它 也 会 增加 涉及 堆 分 配 值 的 每 一 个 赋值 的 代价 。 与 此 相对 ， 在 分 配器 能 够 找到 所 需 空间 之 前 ， 批 回收 器 
都 不 会 带 来 任何 代价 。 然 而 在 这 一 点 上 ， 在 回收 过 程 中 ， 程 序 要 承受 整个 回收 代价 。 因 此 ， 每 一 次 分 配 
都 可 能 激活 一 次 回收 。 

标记 清理 回收 器 检查 整个 堆 ， 而 拷贝 回收 器 只 检查 活 数据 。 拷 贝 回收 器 实际 上 移动 每 一 个 活 的 对 象 ， 
而 标记 回收 器 却 把 活着 的 对 象 留 在 原来 的 位 置 上 。 这 些 代价 之 间 的 权衡 随 着 应 用 的 行为 而 变化 ， 也 随 着 
各 种 内 存 引 用 的 实际 代价 而 变化 。 

引用 计数 的 实现 和 保守 批 回收 器 在 识别 环 结 构 上 存在 问题 ， 因 为 它们 不 能 区 分 环 内 引用 和 非 环 内 引 
用 之 间 的 差异 。 标 记 清 理 回收 器 从 一 组 外 部 指针 开始 ， 所 以 它们 能 够 发 现 一 个 死 的 环 结构 是 不 可 达 的 。 
开始 于 同样 一 组 指针 的 拷贝 回收 器 无 法 仅 拷 贝 与 环 相关 的 对 象 。 

拷贝 回收 器 作为 过 程 的 一 个 自然 部 分 压缩 内 存 。 回 收 器 可 以 或 者 更 新 所 有 已 存储 的 指针 ， 或 者 要 求 
为 每 一 个 对 象 的 存 取 使 用 一 个 间接 表 。 精 确 标记 清理 回收 器 也 可 以 压缩 内 存 。 回 收 器 可 以 把 对 象 从 内 存 
的 一 端 移 到 内 存 另 一 端的 自由 空间 里 。 同 样 ， 这 一 回收 器 可 以 或 者 重 写 现存 的 指针 ， 或 者 要 求 使 用 一 个 
间接 表 。 

好 的 实现 器 一 般 可 以 使 得 标记 清理 回收 器 和 拷贝 回收 器 都 足够 优秀 ， 以 至 于 对 于 大 多 数 应 用 来 说 二 
者 都 是 可 接受 的 。 在 不 能 忍受 不 可 预知 负荷 的 应 用 中 ， 例 如 实时 控制 器 中 ， 回 收 器 必须 以 类 似 于 摊派 引 
用 计数 方案 的 模式 增 量 地 实施 回收 过 程 。 这 样 的 回收 器 被 称 为 实时 回收 器 (real-time collector). 


6.8 概括 和 展望 


继 汇编 语言 之 后 ， 基 础 理论 提供 了 更 抽象 的 程序 设计 模型 ， 从 而 提高 程序 员 的 生产 力 和 程序 的 可 理 
解 性 。 添 加 到 程序 设计 语言 中 的 每 一 个 抽象 要 求 在 执行 前 翻译 成 目标 机 器 的 指令 集合 的 翻译 技术 。 本 章 
揭示 了 翻译 某 些 抽象 的 若干 常用 技术 。 

过 程 化 程序 设计 发 明 于 程序 设计 历史 的 早期 。 若 干旱 期 过 程 是 早期 计算 机 的 调试 例 程 ， 使 用 这 些 预 
先 写 好 的 例 程 ， 程 序 员 能 够 了 解 错误 程序 的 运行 时 状态 。 如 果 没 有 这 样 的 例 程 ， 那 么 我 们 现在 认为 理 所 
当然 的 任务 ， 诸 如 变量 内 容 检 查 或 调用 栈 的 踪迹 等 任务 都 要 求 程序 员 无 误 地 键入 长 长 的 机 器 语言 序列 。 

诸如 Algol 60 等 语言 中 的 词法 作用 域 的 引入 对 语言 设计 产生 了 长 期 的 影响 。 大 多 数 现代 程序 设计 语 
言 把 Algol 的 某 些 思想 带 入 命名 和 可 寻 址 性 。 诸 如 存 取 链 和 显示 等 20 世 纪 60 年 代 和 20 世 纪 70 年 代 发 展 起 
来 的 技术 减少 了 这 一 抽象 的 运行 时 代价 。 这 些 技术 至 今 仍 在 使 用 。 

面向 对 象 语言 采用 类 Algol 语 言 的 作用 域 概念 ， 并 以 数据 制导 方式 对 这 些 概念 重 定位 。 面 向 对 象 
语言 的 编译 器 运用 为 词法 作用 域 而 发 明 的 编译 时 和 运行 时 结构 来 实现 特定 程序 的 继承 层次 带 来 的 命名 
规则 。 

现代 语言 已 添加 了 一 些 新 手法 。 通 过 使 过 程 成 为 第 一 类 对 象 ， 诸 如 Scheme 等 语言 创建 了 新 的 控制 流 
范 型 。 这 些 都 要 求 对 传统 的 实现 技术 做 一 些 改革 ， 例 如 活动 记录 的 堆 分 配 。 同 样 地 ， 隐 式 回 收 被 人 们 日 
益 接 受 ， 这 要 求 对 指针 的 暂时 性 保守 处 理 。 如 果 编 译 器 能 够 更 小 心地 运行 并 把 程序 员 从 以 往 的 释放 存储 
中 再 一 次 解放 出 来 ， 这 似乎 是 一 个 很 好 的 折 中 方案 。( 长 期 的 经 验 表 明 ， 程 序 员 并 不 能 很 好 地 释放 他 们 
分 配 的 所 有 存储 。 他 们 还 释放 保留 着 指针 的 对 象 。) 

当 新 的 程序 设计 范例 开始 流行 时 ， 这 些 范 例 也 将 引入 要 求 更 精密 的 思想 和 实现 的 新 抽象 。 通 过 研究 
以 往 成 功 的 技术 并 理解 在 真实 实现 中 所 涉及 的 代价 和 限制 ， 编 译 器 设计 者 可 以 开发 通过 使 用 高 级 抽象 降 
低 运行 时 损失 的 策略 。 
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本 章 注 释 


本 章 中 的 很 多 资料 来 自 于 编译 器 构造 团队 积累 起 来 的 经 验 。 学 习 更 多 有 关 各 种 语言 的 名 字 空 间 结 构 
的 最 好 方法 就 是 参考 语言 定义 本 身 。 这 些 文献 是 编译 器 设计 者 的 必要 藏书 。 

过 程 出 现在 最 早 的 高 级 语言 中 ， 即 出 现在 比 汇编 语言 更 抽象 的 语言 中 。FORTRAN [26] 和 Algol 60 
[265] 的 过 程 都 带 有 现代 语言 拥有 的 大 多 数 性 质 。 出 现在 20 世 纪 60 年 代 末 的 面向 对 象 语言 SIMULA 67 
[269] 被 其 后 的 Smalltalk 72 [2231 所 继承 。 

词法 作用 域 是 在 Algol 60 中 引入 的 而 且 一 直 沿 用 至 今 。 早 期 的 Algol 编 译 器 引入 了 本 章 描述 的 很 多 支 
持 机 制 ， 其 中 包括 活动 记录 、 存 取 链 和 参数 传递 技术 。6.3 节 到 6.6 节 的 大 部 分 素材 都 出 现在 这 些 早 期 的 
系统 中 [282]。 优 化 迅速 出 现 ， 如 把 块 级 作用 域 的 存储 八 入 过 程 的 活动 记录 中 。 早 期 的 IBM 370 链 接 约定 
考虑 了 叶 过 程 和 其 他 过 程 之 间 的 差异 ; 它们 避免 了 为 叶 例 程 分 配 寄存 器 保存 区 。Murtagh 采 用 了 更 完备 、 
更 系统 化 的 方法 来 合并 活动 记录 [264]。 . 

内 存 布局 的 经 典 参 考 文献 以 及 内 存 分 配方 案 的 经 济 学 来 自 于 Kunth 的 《计算 机 程序 设计 艺术 (Art of 
Computer Programming )》[220，2.5 节 ]。 构 建 在 常用 大 小 的 池上 的 现代 分 配器 出 现 于 20 世 纪 80 年 代 初 期 。 

引用 计数 要 追溯 到 20 世 纪 60 年 代 初 ， 而 且 已 被 用 于 很 多 系统 [90，117]。Cohen 和 后 来 的 Wilson 给 出 
有 关 垃 圾 回收 的 文献 的 广泛 概览 [87，332]。 保 守 回 收 器 是 由 Boehm 和 Weiser 引 入 的 概念 [44，112，42]。 
拷贝 回收 器 是 为 回应 虚拟 内 存 系统 而 出 现 的 [137，74]; 它们 在 某 种 程度 上 很 自然 地 导致 今天 广泛 使 用 的 

世代 回收 器 (238, ，324]。Hanson 引 入 了 基于 实 存 块 的 分 配 的 概念 [171]。 


7.1 概述 


在 实践 中 ， 编 译 器 能 够 在 给 定 的 目标 机 器 上 以 多 种 方式 实现 某 些 源 语言 的 构造 。 这 些 变形 使 用 不 同 
的 操作 和 方法 。 其 中 有 些 实现 比 另 外 一 些 要 快 ; 有 些 使 用 较 少 内 存 ; 有 些 使 用 较 少 寄存 器 ; 有 些 在 执行 
期 间 可 能 消耗 较 少 能 量 。 我 们 认为 这 些 差异 是 代码 形态 (code shape) 的 问题 。 

代码 形态 对 编译 代码 的 行为 、 优 化 器 的 能 力 以 及 改进 代码 形态 的 后 端 有 着 很 强 的 影响 。 例 如 ， 考 虑 
C 语 言 编 译 器 实现 通过 单字 节 字 符 值 进行 切换 的 switch 语 句 的 方式 。 编 译 器 可 能 会 使 用 一 系列 级 联 if- 
then-else 语 句 来 实现 这 一 switch 语 句 。 依 据 测试 的 布局 ， 这 将 产生 不 同 的 结果 。 如 果 第 一 次 测试 是 0， 
第 二 次 测试 是 1， 以 此 类 推 ， 那 么 这 一 方法 将 退化 成 一 个 256 个 关键 字 域 上 的 线性 搜索 。 如 果 字 符 是 均匀 
分 布 的 ， 那 么 字符 搜索 对 每 一 个 字符 将 需要 平均 128 次 测试 和 分 支 ， 这 是 实现 选择 语句 的 昂贵 方法 。 相 
反 ， 如 果 测 试 执行 二 分 搜索 ， 那 么 平均 情况 将 包含 八 次 测试 和 分 支 ， 这 个 数字 显然 更 好 。 为 了 以 数据 空 
间 为 代价 提高 速度 ，C 语 言 编译 器 可 以 构造 一 个 256 个 标签 的 表格 ， 而 且 通 过 装 入 相应 的 表格 项 并 跳 转 到 
这 一 表 项 来 解释 字符 ， 那 么 对 每 个 字符 都 有 常量 负荷 。 

所 有 这 一 切 都 是 Switch 语句 的 合法 实现 。 对 特殊 Switch 语句 决定 哪 一 个 实现 有 意义 要 依赖 于 很 多 因 
素 。 特 别 地 ， 各 个 情况 的 数量 以 及 它们 相对 的 执行 频率 非常 重要 ， 同 样 目标 机 器 上 的 分 支 的 代价 结构 的 
细节 信息 也 非常 重要 。 即 使 编译 器 无 法 得 到 它 做 出 最 好 的 选择 所 需要 的 信息 ， 它 也 必须 做 出 选择 。 可 能 
实现 之 间 的 差异 和 编译 器 的 选择 是 代码 形态 的 问题 。 

作为 另 一 个 例子 ， 考 虑 简单 表达 式 x+y+z， 其 中 x、y 和 z 是 整数 。 图 7-1 给 出 实现 这 一 表达 式 的 几 个 
方法 。 在 源 代码 形式 中 ， 我 们 可 能 把 操作 想 成 一 个 三 元 加 法 ， 如 左边 所 示 。 然 而 ， 把 这 一 理想 化 的 操作 
映射 到 一 系列 二 元 加 法 揭示 出 评估 顺序 的 影响 。 右 边 所 示 的 三 个 译本 给 出 三 种 可 能 的 评估 顺序 ， 包括 三 
地 址 代码 和 抽象 语法 树 。( 我 们 假设 每 个 变量 都 在 适当 的 命名 寄存 器 中 ， 而 且 假设 源 语 言 不 给 这 样 的 表 
达 式 指定 评估 顺序 。) 因为 整数 加 法 满足 交换 律 和 结合 律 ， 因 此 这 三 个 顺序 是 等 价 的 ; 编译 器 必须 选择 
其 一 来 实现 。 


nertrlner+r, 
tg ry + ry fe &— Ty + Ty 





图 7-1 x+y+z 的 不 同 代码 形态 
左 结合 将 生成 第 一 棵 二 又 树 。 由 于 左 结合 对 应 于 我 们 从 堪 到 右 的 阅读 风格 ， 这 棵 树 似乎 很 “自然 "。 
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如 果 我 们 用 文字 常数 2 代替 y 而 用 3 代替 z， 将 发 生 什么 呢 ? 当然 ，x+2+3 等 价 于 x+5。 编 译 器 应 该 发 现 2+3 
的 计算 ， 评 估 它 并 把 结果 直接 登 人 代码 中 。 然 而 ， 在 左 结合 形式 中 ，2+3 从 不 出 现 。 顺 序 x+y+z 把 2+3 隐 
藏 起 来 。 右 结合 译本 揭示 出 改进 的 机 会 。 然 而 对 每 一 种 可 能 的 树 ， 都 存在 使 结果 表达 式 不 适 于 优化 的 x、 
y 和 z 的 变量 和 常量 赋值 。 

同 switch 语 句 一样 ， 在 没有 关于 这 一 表达 式 所 在 的 上 下 文 的 信息 的 条 件 下 ， 这 一 表达 式 的 最 佳 形态 
是 不 可 知 的 。 例 如 ， 如 果 表 达 式 x+y 最 近 已 被 计算 ,x 的 值 和 y 的 值 都 没有 发 生变 化 ， 那 么 使 用 最 左边 的 
形态 将 使 编译 器 用 对 之 前 计算 结果 值 的 引用 取代 第 一 个 操作 me 一 rxtry。 在 这 种 情况 下 ， 这 三 个 评估 顺序 
中 的 最 佳 选择 可 能 依赖 于 这 一 代码 周围 的 上 下 文 。 l 

本 章 探索 在 实现 很 多 常用 的 源 语言 结构 中 引发 的 代码 形态 问题 。 这 一 章 集中 讨论 为 特定 结构 所 生成 
的 代码 的 形态 问题 ， 而 在 很 大 程度 上 忽视 选 出 特定 汇编 语言 指令 所 需 的 算法 。 指 令 乌 选 、 寄 存 器 分 配 和 
指令 调度 等 问题 将 在 后 面 章节 中 分 别 讨论 。 


7.2 指定 存储 位 置 


一 个 过 程 可 能 计算 很 多 值 。 其 中 的 一 些 值 在 源 代码 中 具有 名 字 ; 在 类 Algol 语 言 中 ， 程 序 员 给 每 个 
变量 提供 一 个 名 字 。 另 外 一 些 值 没 有 明确 的 名 字 ， 例 如 表达 式 A[i-3，j+2] 中 的 值 i-3 就 没有 名 字 。 命 名 
值 具有 固定 的 生存 期 。 它 们 可 能 被 其 他 过 程 修改 。 它 们 在 调试 器 中 也 许 是 可 视 的 。 这 些 事实 限制 编译 器 
放置 它们 的 位 置 以 及 保存 它们 的 期 间 。 相 反 ， 编 译 器 在 处 理 未 命名 值 ， 如 i-3 时 却 有 更 多 的 自由 。 编 译 
器 必须 按照 与 程序 的 意义 一 致 的 方法 处 理 它们 ， 但 是 编译 器 在 决定 它们 的 驻 留 地 和 存放 期 间 上 却 有 相当 
大 的 回旋 余地 。 

编译 器 对 于 命名 值 和 非 命 名 值 的 决策 对 它 生 成 的 最 终 代 码 有 着 很 大 的 影响 。 特 别 地 ， 关 于 非 命 名 值 
的 决策 决定 优化 器 可 以 分 析 和 转换 的 值 的 集合 。 在 为 每 一 个 值 选择 存储 位 置 时 ， 编 译 器 必须 遵守 源 语言 
和 目标 机 器 的 内 存 层次 的 规则 。 编 译 器 一 般 可 以 把 标量 值 放 到 寄存 器 或 内 存 中 。 可 用 内 存 可 能 被 分 割 成 
不 同 的 子 区 域 或 数据 区 域 ， 如 第 6 章 所 述 。 


7.2.1 布局 数据 区 
为 了 给 类 Algol 语 言 中 的 变量 指定 存储 类 ， 编 译 器 可 能 要 使 用 类 似 于 下 面 的 规则 : 


车 x 在 过 程 p 中 被 局 部 声明 ， 且 
它 的 值 在 p 的 不 同调 用 间 不 被 保存 
则 将 其 赋值 到 过 程 局 部 存储 空间 
车 它 的 值 在 p 的 不 同调 用 间 被 保存 
则 将 其 赋值 到 过 程 静 态 存 储 空 间 
车 x 被 声明 为 会 局 可 视 
则 将 其 赋值 到 全 局 存储 空间 
车 XY 是 在 程序 的 控制 下 分 配 的 
则 将 其 赋值 到 运行 时 堆 


面向 对 象 语言 所 遵循 的 规则 与 此 不 同 ， 但 复杂 程度 相似 。 

每 个 数据 区 都 有 其 自身 的 限制 。 编 译 器 可 以 把 过 程 局 部 存储 空间 放置 在 这 一 过 程 的 活动 记录 中 ， 这 
是 因为 一 个 过 程 局 部 变量 的 生存 期 与 这 个 过 程 的 一 次 调用 的 生存 期 相 匹配 。 因 为 代码 总 是 需要 寄存 器 中 
的 ARP， 这 导致 使 用 像 1oadA0 和 1oadAI 等 操作 的 高 效 存 取 。 频 繁 对 AR 的 存 取 导 致 将 其 保留 在 高 速 缓冲 
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器 中 。 

静态 数据 区 和 全 局 数据 区 将 被 存储 在 过 程 AR 的 外 部 ， 因 为 它们 的 生存 期 可 能 超过 这 次 调用 ， 直 到 
程序 的 全 部 执行 。 这 可 能 需要 额外 的 10adI 把 可 重 定位 符号 (汇编 语言 的 标签 ) 的 运行 时 地 址 引入 到 寄 
存 器 中 来 作为 基地 址 使 用 。 

存储 在 堆 中 的 值 具有 编译 器 无 法 预测 的 生存 期 。 可 以 通过 两 个 不 同 机 制 把 值 放 入 堆 中 。 程 序 员 可 以 
明确 地 分 配 堆 的 存储 ; 编译 器 不 能 不 考虑 这 一 决定 。 当 编译 器 发 现 一 个 值 可 能 比 创建 它 的 过 程 生存 期 长 
时 ， 它 可 以 把 这 个 值 放 入 堆 中 。 无 论 哪 种 情况 ， 堆 中 的 值 是 通过 完整 的 地 址 来 表示 ， 而 不 是 通过 偏 移 量 
来 表示 的 。 


7.2.2 把 值 保存 在 寄存 器 中 


除了 给 每 一 个 值 赋 一 个 数据 区 和 位 置 之 外 ， 编 译 器 必须 确定 能 否 安全 地 把 这 个 值 保 留 在 寄存 器 中 。 
如 果 这 个 值 可 以 安全 地 驻 留 在 一 个 寄存 器 中 ， 而 且 某 个 寄存 器 在 这 个 值 的 整个 生存 期 都 是 可 用 的 ， 那 么 
这 个 值 在 内 存 中 不 需要 空间 。 很 多 编译 器 给 可 以 合法 驻 留 在 寄存 器 内 的 每 个 值 指定 一 个 虚拟 寄存 器 
(virtual register)， 并 依靠 寄存 器 分 配器 把 虚拟 寄存 器 映射 到 目标 机 器 的 物理 寄存 器 上 。 | 

如 果 编 译 器 使 用 虚拟 寄存 器 ， 那 么 它 给 每 一 个 值 或 者 指定 一 个 虚拟 寄存 器 或 者 指定 一 个 内 存 位 置 ， 
但 是 不 能 二 者 兼 有 。 当 分 配器 决定 它 不 能 把 某 个 虚拟 寄存 器 保留 在 寄存 器 集合 中 时 ， 分 配器 把 那个 值 存 
储 到 为 溢出 寄存 器 而 保留 的 内 存 区 域 的 空间 中 。 分 配器 在 这 个 值 的 每 一 次 使 用 插入 一 个 装 入 指令 把 这 值 
移 到 一 个 临时 寄存 器 ， 并 且 在 每 一 次 定义 之 后 插入 一 个 存储 指令 更 新 内 存 中 的 这 个 值 。 如 果 分 配器 把 一 
个 静态 值 保留 在 寄存 器 中 ， 那 么 分 配器 必须 在 过 程 中 第 一 次 使 用 这 个 值 之 前 装 人 这 个 值 ， 并 在 离开 这 个 
过 程 (以 上 两 个 任务 一 个 是 在 一 个 过 程 的 出 口 ， 另 一 个 在 调用 地 点 完成 ) 之 前 把 这 个 值 存 放 回 内 存 中 。 

为 了 确定 是 否 将 一 个 值 保留 在 寄存 器 中 ， 编 译 器 必须 知道 代码 可 以 通过 多 少 个 不 同 的 名 字 来 存 取 这 
个 值 。 例 如 ， 一 个 局 部 变量 将 保存 在 寄存 器 中 ， 只 要 从 不 提取 它 的 地 址 、 它 的 值 从 不 用 于 同 套 的 过 程 中 
而 且 它 从 不 作为 引用 调用 参数 被 传递 给 另 一 个 过 程 。 这 些 动 作 的 每 一 个 都 为 存 取 这 一 变量 创建 第 二 条 路 
径 。 考 虑 下 面 C 语 言 的 代码 片段 : l 

void fee() { 

int a, *b; 

b = ba; 

} 


赋值 b=&a 创 建 代 码 可 以 用 于 存 取 a 的 另 一 个 名 字 。 编 译 器 必须 给 a 指 定 一 个 存储 位 置 ; 否则 编译 器 不 
能 有 意义 地 对 a 运用 取 地 址 操作 符 。 然 而 ， 编 译 器 甚至 不 能 在 a 的 连续 引用 之 间 把 a 的 值 保留 在 寄存 器 中 ， 
除非 它 能 够 证 明 这 一 期 间 代码 不 能 给 *b 赋 值 。 同 样 地 ， 编 译 器 也 不 能 在 引用 之 间 把 *b 的 值 保 留 在 寄存 器 
中 ， 除 非 它 能 证 明 这 一 期 间 代 码 不 能 给 a 赋值 。 

两 个 引用 之 间 的 代码 一 般 可 以 包含 其 他 基于 指针 的 赋值 或 可 能 含有 基于 指针 的 赋值 的 过 程 调用 。 同 
样 ， 过程 中 的 多 条 路 径 可 能 给 b 指 定 其 他 地 址 。 总 之 ， 这 些 复 杂 的 情况 使 得 对 把 a 或 *#b 保 留 在 寄存 器 所 需 
的 分 析 更 加 困难 。 在 实践 中 ， 很 多 编译 器 放弃 这 一 分 析 并 把 a 留 在 内 存 中 。 

一 个 可 以 保存 在 寄存 器 中 的 值 有 时 被 称 为 非 歧义 性 值 (unambiguous value) ; 可 能 有 多 个 名 字 的 变 
量 被 称 为 歧义 性 值 (ambiguous value)。 有 若干 引发 歧义 性 的 方式 。 存 储 在 基于 指针 的 变量 中 的 值 经 党 
是 歧义 性 的 。 引 用 调用 形 参 与 名 字 作用 域 规则 之 间 的 相互 作用 使 得 这 样 的 形 参 具有 歧义 性 。 很 多 编译 器 
把 数组 元 素 值 当 作 歧义 性 值 处 理 ， 因 为 编译 器 无 法 告知 诸如 A[1，j] 和 Am，n] 这 样 的 两 个 引用 会 否 涉及 
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同一 位 置 。 编 译 器 可 以 执行 分 析 消除 其 中 的 某 些 歧义 性 。 遗 憾 的 是 ， 分 析 无 法 解决 所 有 的 歧义 性 问题 。 
因此 ， 编 译 器 必须 小 心 ， 做 好 正确 地 处 理 歧义 性 问题 的 准备 。 | 

编译 器 必须 把 任意 值 作为 歧义 性 值 处 理 ， 除 非 它 能 够 证 明 这 个 值 是 非 歧 义 性 的 。 歧 义 性 值 被 保存 在 
内 存 中 而 不 是 寄存 器 中 ; 必要 时 它们 被 装 入 和 存储 。 对 语言 仔细 推理 可 以 帮助 编译 器 。 例 如 ， 在 C 语 言 
中 ， 从 不 被 提取 地 址 的 所 有 局 部 变量 都 是 非 歧 义 性 的 。 同 样 地 ，ANSI C 标 准 要 求 通过 指针 变量 的 引用 
是 类 型 相 容 的 ; 因此 ， 对 *b 的 赋值 只 能 改变 作为 合法 指针 的 b 的 位 置 的 值 。 遗 憾 的 是 ， 这 一 标准 把 字符 
指针 从 这 一 限制 中 除去 ， 所 以 对 字符 指针 的 赋值 能 够 改变 任意 类 型 的 值 。 

ANSI C 包 含 两 个 关键 字 ， 它 们 对 编译 器 分 析 可 能 的 歧义 性 值 内 容 的 能 力 产生 影响 。restrict 关 键 
字 让 程序 员 声 明 一 个 指针 是 非 歧义 性 的 。 它 通常 被 用 于 一 个 过 程 在 一 个 调用 地 点 直接 传递 一 个 地 址 的 时 
候 。vo1ati1e 关 键 字 让 程序 员 声明 一 个 变量 的 内 容 可 能 随意 改变 并 且 不 必 通 知 。 这 一 关键 字 被 用 于 硬件 
设备 寄存 器 以 及 可 能 通过 中 断 服务 例 程 或 应 用 中 的 其 他 控制 线程 修改 的 变量 。 


7.2.3 机 器 特性 


对 于 任意 处 理 器 ， 编 译 器 设计 者 将 发 现 编译 器 必须 遵守 一 组 机 器 特有 的 规则 。 

体系 结构 可 能 要 把 寄存 器 单元 分 成 不 同 的 类 。 这 些 类 可 能 是 不 相交 的 ; 一 个 常用 的 方案 是 把 寄存 器 
文件 卷宗 分 隔 成 “ 祥 点 ”寄存 器 和 “通用 ”寄存 器 。 这 些 类 相互 间 可 以 部 分 生生， 如 在 “ 浮 点 ”寄存 器 
和 “ 双 精 度 浮 点 ”寄存 器 中 所 发 生 的 那样 。 在 一 个 类 中 ， 可 能 有 附加 的 限制 ， 如 双 精 度 浮 点 值 必须 占据 
一 对 相 邻 的 寄存 器 这 样 的 体系 结构 。 其 他 常用 寄存 器 类 包括 条 件 代码 寄存 器 、 谓 词 寄存 器 、 分 支 目标 寄 
存 器 以 及 段 寄存 器 。 

这 一 体系 结构 可 能 把 一 个 寄存 器 类 划分 成 多 个 不 相交 的 寄存 器 文件 卷宗 。 这 样 的 机 器 在 一 组 寄存 器 
聚合 一 组 功能 单元 。 每 个 功能 单元 对 它 相 邻 的 寄存 器 可 以 快速 存 取 ， 而 对 其 他 寄存 器 组 中 的 寄存 器 只 能 
做 受 限 存 取 。 这 一 策略 让 体系 结构 设计 者 使 用 更 多 的 功能 单元 。 它 给 编译 器 带 来 配置 操作 和 数据 的 负担 。 

内 存 常 驻 值 也 同样 引发 目标 机 器 特有 的 问题 。 很 多 体系 结构 基于 值 的 类 型 来 对 它 的 开始 地 址 做 限制 。 
因此 ， 它 可 能 要 求 整数 和 单 精度 浮 点 数据 始 于 一 个 字 的 边界 《 即 字 大 小 的 整数 倍 的 地 址 )， 而 字符 数据 
可 能 始 于 任意 侦 地 址 。 双 字 和 四 售 字 长 边界 也 可 能 出 现 。 

指定 存储 的 细节 问题 将 直接 影响 性 能 。 随 着 内 存 层次 变 得 更 深 且 更 复杂 ， 局 部 化 和 复 用 的 问题 对 运 
行 时 间 有 很 大 的 影响 。 通 过 改变 内 存 中 代码 和 数据 的 布局 和 重 排 存 取 ， 编 译 器 可 以 加 强 局 部 化 和 复 用 。 


7.3 算术 操作 符 


现代 处 理 器 为 评估 表达 式 提供 广泛 的 支持 。 典 型 的 RISC 机 器 有 完整 的 三 地 址 操作 ， 包 括 算 术 操 作 、 
逻辑 移 位 和 布尔 操作 。 三 地 址 形式 让 编译 器 对 任意 操作 的 结果 命名 ， 并 将 其 保存 以 备 后 面 的 复 用 。 三 地 
址 形式 还 消除 二 地 址 指令 的 主要 复杂 性 之 一 ， 即 破坏 性 操作 。 

为 了 生成 诸如 x+y 这 样 的 平凡 表达 式 的 代码 ， 编 译 器 首先 发 行 确保 x 和 y 的 值 在 如 r. 和 ry 这 样 的 已 知 寄 
存 器 中 的 代码 。 如 果 x 被 存储 在 内 存 中 的 当前 活动 记录 中 偏 移 量 为 ex 处 ， 那 么 结果 代码 可 能 是 : 


loadI @x > 
loadAQ rarps ri => rx 


然而 ， 如 果 x 的 值 已 经 在 一 个 寄存 器 中 ， 编 译 器 可 以 使 用 这 个 寄存 器 的 名 字 代替 rx。 编 译 器 根据 类 
似 的 决策 链 确保 y 在 一 个 寄存 器 中 。 最 后 ， 编 译 器 发 行 如 下 所 示 的 执行 加 法 的 指令 


add r,, ry=r, 
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如 果 这 一 表达 式 是 用 树 表示 的 ， 那 么 上 面 的 方案 很 自然 地 适合 于 树 的 后 序 遍 历 。 图 7-2a 的 代码 通过 
把 代码 生成 动作 嵌入 一 个 递归 树 亡 历 例 程 来 实现 这 一 代码 的 发 行 。 它 依赖 于 两 个 例 程 base 和 offset 来 隐 
茂 某 些 复杂 性 。0ase 例 程 返 回 保存 一 个 标识 符 的 基地 址 的 寄存 器 名 ; 如 果 需 要 ，base 发 行 把 这 一 基地 址 
放 入 一 个 寄存 器 中 的 代码 。offset 例 程 有 类 似 的 功能 ; 它 返 回 一 个 寄存 器 名 ， 这 个 寄存 器 保存 这 个 标识 
符 相对 于 base 返 回 的 地 址 的 偏 移 量 。 


expr(node) { 
int result, tl, t2; 


switch(type(node)) { 
case x, +, +, —: 
tl + expr(LeftChild(node)); Ka DS 
t2 + expr(RightChild(node)); J 
result +- NextRegister(); 2 N 
emit(op(node), t1, t2, result); y 
break; 


case IDENT. Dacer yaa 
: Es 
tl + base(node); 语法 树 
t2 + offset(node); 
result — NextRegister(); 
emit(1oadAQ, tl, t2, result); 
break; 


case NUM: 
result + NextRegister(); 
emit(\oadI, val(node), none, loadI 2 = 13 


result), load] @y > r 
break; 


loadI @x => rı 
1oadA0 rarpsrl = rz 


loadA0 Tarp, Te => rs 
return result: mult 13, rs > rs 
sub V2. V6 => "y 


a) 树 遍 历代 码 生成 器 c) 原始 代码 





图 7-2 表达 式 的 简单 树 遍历 


同样 的 代码 处 理 +、-、x 和 :+ 。 从 代码 生成 的 角度 看 ， 这 些 操作 符 是 可 互 换 的 (忽视 交换 性 )。 对 
如 图 7-2b 所 示 的 表达 式 x-2 x y 的 AST 调 用 图 7-2a 中 的 例 程 expr 生 成 如 图 7-2c 所 示 的 结果 。 这 一 例子 假设 
无 论 x 还 是 y 都 不 是 已 在 寄存 器 中 ， 且 假设 二 者 都 存储 在 当前 的 AR 中 。 

注意 代码 生成 的 这 一 树 遍历 方法 与 如 图 4-14 所 示 的 专用 语法 制导 翻译 方案 之 间 的 类 似 性 。 这 一 树 遍 
历 算法 使 细节 更 加 明了 ， 包 括 终 止 符 和 在 右 子 树 之 前 评估 左 子 树 的 处 理 。 语 法 制导 翻译 方案 把 第 一 种 情 
况 抽 象 掉 了 。 它 没有 评估 顺序 的 控制 ， 因 为 分 析 器 为 各 个 动作 规定 运用 顺序 。 但 是 ， 这 两 个 方案 大 体 上 
生成 等 价 的 代码 。 


7.3.1 降低 对 寄存 器 的 要 求 


很 多 问题 影响 着 生成 代码 的 质量 。 例 如 ， 存 储 位 置 的 选择 就 对 代码 质量 有 直接 的 影响 ， 甚 至 对 这 一 
简单 表达 式 也 是 如 此 。 如 果 y 在 全 局 数据 区 域内 ， 把 y 放 和 人 一 个 寄存 器 所 需要 的 指令 序列 可 能 要 求 一 个 附 
加 的 10adI 以 便 得 到 保存 这 个 值 的 基地 址 ， 并 使 用 一 个 寄存 器 来 保存 这 个 值 。 另 外 ， 如 果 y 在 一 个 寄存 器 
中 ,用 于 把 y 装 和 人 rs 的 两 个 指令 可 以 省 略 ， 而 且 编译 器 将 在 mult 指 令 中 使 用 保存 y 的 寄存 器 名 。 把 值 保存 
在 寄存 器 中 既 可 以 避免 内 存 存 取 又 可 以 避免 任意 的 地 址 计算 。 如 果 x 和 y 都 在 寄存 器 中 ， 上 面 的 七 指令 序 
列 将 被 缩短 到 三 指令 序列 (如果 目 标 机 器 支持 立即 乘 指令 ， 则 可 缩短 到 二 指令 序列 )。 
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被 编 入 树 遍 历代 码 生 成 器 的 代码 形态 决策 也 产生 效应 。 上 图 中 的 原始 代码 使 用 八 个 寄存 器 ， 包 括 
rarp。 这 一 代码 倾向 于 假设 在 编译 的 后 期 ， 寄 存 器 分 配器 可 以 把 寄存 器 的 数量 降 到 最 少 。 例 如 ， 寄 存 器 
分 配器 可 能 把 这 一 表达 式 重 写 为 : 

1oadI @x => r 

10adA0 rarp, ri > ri 

loadI 2 > rz 

loadI @y => 13 

loadAO rarp, r3 > r3 

mult re, ri > r 

sub ris Yo ë >r 


CS IEA PERI, Gra. RAR AEP, kar h xr h Hya 
以 在 后 面 使 用 。 

然而 ， 在 计算 2 x y 之 前 装 入 x 仍 然 浪费 一 个 寄存 器 ， 这 是 由 于 在 树 遍 历代 码 生 成 器 中 在 右 子 结 点 之 
前 先 评估 左 子 结 点 这 一 决策 造成 的 。 使 用 相反 的 顺序 可 以 产生 下 面 代 码 中 左边 所 示 的 序列 。 寄 存 器 分 配 
器 可 以 重 写 这 一 序列 使 其 只 使 用 两 个 寄存 器 〈 和 ra)， 如 右边 所 示 : 


1oadI @y > ñ 1oadI @y => "i 
loadAO Tarps ri > r? loadA0 rarps i => ri 
loadI 2 => 73 loadI 2 => ™ 
mult 3, rz = f4 mlt men Sh 
loadI @x => rs loadI @x => rz 
1oadAO rarpsrs = re loadAO rarpsr2 => rz 
sub Toe, To => 17 sub Yoo >ñ 
首先 评估 2 x y 寄存 器 分 配 后 


这 个 分 配器 不 能 把 x、y 和 x+2 x y 都 装 和 人 两 个 寄存 器 中 。 正 如 所 写 的 那样 ， 这 一 代码 保存 x， 但 不 保 
存 y。 尽管 谨慎 的 优化 可 以 通过 移动 这 一 序列 在 计算 的 后 期 装 入 x 从 而 把 三 寄存 器 代码 改 成 二 寄存 器 代码 ， 
但 是 生成 这 样 的 序列 也 许 更 容易 且 更 直接 ， 这 一 序列 在 优化 和 寄存 器 分 配 之 后 将 产生 更 好 的 代码 。 

当然 ， 首 先 评估 右 子 结 点 不 是 一 般 的 解决 方案 。 对 于 表达 式 2 x y+x 来 说 ， 合 适 的 规则 是 “ 先 评估 左 
子 结 点 "。 诸 如 x+(5+y) x 7 这 样 的 表达 式 无 法 使 用 静态 规则 。 限 制 寄存 器 使 用 的 最 佳 评估 顺序 是 先 计算 
5+y， 再 乘 以 7， 最 后 加 上 x， 在 效果 上 是 在 右 子 结 点 和 左 子 结 点 间 交 替 计 算 。 


















| 生成 立即 地 址 装 入 指令 ， 


细心 的 读者 也 许 注 意 到 图 7-2 中 的 代码 从 不 生成 ILLOC 的 立即 地 址 装 入 指令 1oadAI。 相 反 ， 它 生 
成 一 个 立即 装 人 指令 〈1oadI ) ， 后 面 跟 一 个 地 址 偏 移 量 装 入 指令 (10adA0 ): 


load]! @x > mi Tide ”ioadAi e 
oa Tarps @X r: 
loadA0 rarpyrl => rz arp >r 


在 本 书 中 ， 我 们 已 假设 生成 两 操作 序列 比 生 单一 操作 更 好 。 下 面 三 个 因素 给 出 推荐 这 一 做 法 的 | 
解释: 
1) 较 长 的 代码 序列 为 ex 给 出 一 个 明确 的 名 字 。 如 果 @x 在 10adA0 指 令 之 外 的 上 下 文中 被 复 用 ， | 
那么 这 个 明确 的 名 字 是 有 用 的 。 | 
2) 偏 移 量 @x 对 10adAI 操 作 的 立即 域 来 说 可 能 太 大 。 如 果 这 个 偏 移 量 不 合适 ， 那 么 编译 器 必须 
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或 者 生成 使 用 1oadI 的 序列 或 者 把 这 个 标签 存储 在 内 存 中 并 使 用 一 个 完整 的 1oad 重 新 得 到 它 。 

3) 上 述 两 指令 序列 在 代码 生成 器 中 导致 一 个 清晰 的 功能 分 解 ， 如 图 7-2 所 示 。 把 常量 迭 入 子 序 
列 1oadA0 所 需 的 逻辑 是 一 种 优化 。 | 

如 果 常 量 偏 移 量 不 被 复 用 , 那么 子 序列 优化 可 以 单纯 地 把 这 一 两 指令 序列 变换 成 单一 的 1oadAI。 f 
例如 ， 如 果 中 间 寄 存 器 需要 用 于 其 他 某 个 值 ， 那 么 某 些 寄存 器 分 配器 可 以 自动 地 执行 这 一 转换 ( 参 
见 第 13 章 )。 

如 果 编 译 器 需要 直接 生成 10adAI， 有 两 个 方法 有 意义 。 编 译 器 设计 者 可 以 把 包含 于 base 和 
offset 中 的 选择 逻辑 向 上 推 向 图 7-2 中 的 IDENT 的 选择 中 。 这 以 不 美观 但 有 较 少 模块 的 代码 为 代价 实 
现 这 一 目的 。 另 外 ， 编 译 器 设计 者 也 可 以 让 emyt 来 维护 一 个 小 型 指令 缓冲 器 ， 并 在 指令 被 生成 时 对 | 
指令 执行 局 部 窥 孔 优化 (参见 11.4.1 节 )。 保 持 缓冲 器 较 小 使 得 窥 孔 优化 更 实用 。 如 果 编 译 器 遵守 | 
“多 需求 子 树 优先 ”规则 ， 那 么 将 在 1oadA0 指 令 之 前 生成 这 个 偏 移 量 。 在 窥 孔 范例 中 ， 很 容易 识别 
出 供给 1joadA0 中 的 1oadiI 。 













为 了 给 表达 式 树 的 子 树 选择 一 个 最 好 的 评估 顺序 ， 编 译 器 需要 知道 有 关 每 桔子 树 的 详细 信息 。 为 了 
最 小 化 寄存 器 的 使 用 ， 编 译 器 应 该 首先 评估 有 更 多 需求 的 子 树 ， 即 先 评估 需要 更 多 寄存 器 的 子 树 。 代 码 
必须 在 第 二 个 子 树 的 评估 过 程 中 保存 第 一 棵 子 树 中 计算 的 值 ; 因此 ， 首 先 对 需求 较 少 的 子 树 进行 处 理 将 
比 多 需求 子 树 优先 多 要 求 一 个 寄存 器 。 这 需要 对 代码 做 一 个 初始 遍历 以 收集 信息 ， 其 后 再 跟着 一 个 发 行 
真实 代码 的 遍 。 

诸如 专用 语法 制导 翻译 方案 这 样 的 单一 遍 可 以 发 现 需求 更 多 的 子 树 或 者 发 行 代码 。 但 它 不 可 以 两 者 
都 做 。 该 一 般 原 理 ， 即 分 析 后 面 跟着 翻译 或 转换 ， 可 以 运用 到 代码 生成 和 全 局 优化 上 。 如 Floyd 于 1961 
年 发 现 的 那样 ， 如 果 我 们 让 编译 器 在 做 最 后 的 关于 如 何 实现 代码 的 决定 之 前 检查 代码 ， 那 么 编译 器 可 以 
生成 更 好 的 代码 。 


7.3.2 存 取 参 数值 


树 遍 历代 码 生成 器 隐 含 地 假设 存在 对 于 所 有 标识 符 可 行 的 单一 存 取 方 法 。 表示 形式 参数 的 名 字 可 能 
需要 不 同 的 处 理 。 被 传递 到 AR 中 的 值 调 用 参数 可 以 作为 局 部 变量 来 处 理 。 被 传递 到 AR 中 的 引用 调用 参 
数 需要 附加 一 个 间接 寻 址 。 因 此 ， 对 于 引用 调用 参数 x， 编 译 器 可 能 会 生成 下 面 的 代码 来 得 到 x 的 值 。 

loadl @x > ñ 


loadAO Farpsri > rz 
load rz > 13 


前 两 个 操作 把 这 一 参数 值 的 内 存 地 址 移 到 rz。 最 后 的 操作 把 这 个 值 本 身 移 到 rs。 

许多 链接 约定 把 前 面 几 个 参数 传递 到 寄存 器 中 。 如 前 所 述 ， 图 7-2 中 的 代码 不 能 处 理 被 永久 保留 在 
寄存 器 中 的 值 。 然 而 ， 必 要 的 扩展 很 容易 实现 。 

对 于 值 调用 参数 ，IDENT 的 选择 分 支 必须 检查 这 个 值 是 否 已 经 在 寄存 器 中 。 如 果 是 ， 那 么 它 就 给 
resu1t 指 定 寄 存 器 号 ， 或 把 这 个 值 拷贝 到 一 个 新 的 虚拟 寄存 器 中 。 否 则 ， 它 使 用 标准 机 制 来 装 入 内 存 中 
的 这 个 值 。 

对 于 通过 寄存 器 传递 地 址 的 引用 调用 参数 ， 编 译 器 需要 发 行 单一 操作 来 从 内 存 装 和 人 这 个 值 。 然 而 ， 
这 个 值 在 每 一 个 赋值 的 前 后 必须 驻 留 在 内 存 中 ， 除 非 编译 器 可 以 证 明 它 是 非 歧义 性 的 。 


w 
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7.3.3 表达 式 中 的 函数 调用 


至 此 ， 我 们 假设 表达 式 中 的 所 有 操作 数 都 是 变量 、 常 量 和 由 其 他 子 表达 式 所 生成 的 临时 值 。 函 数 调 
用 也 作为 操作 数 出 现在 表达 式 中 。 为 了 评估 函数 调用 ， 编 译 器 简单 地 生成 调用 这 个 函数 所 需要 的 调用 序 
列 (参见 6.6 节 和 7.9 节 ) 并 发 行 把 这 个 返回 值 移 到 寄存 器 中 所 需 的 代码 。 这 一 链接 约定 限制 了 它 对 执行 
函数 的 调用 过 程 的 影响 。 

函数 调用 的 存在 可 能 会 限制 编译 器 改变 表达 式 评估 顺序 的 能 力 。 这 一 函数 可 能 具有 修改 表达 式 中 所 
使 用 的 变量 的 值 的 副作用 。 编 译 器 必须 尊重 源 表达 式 所 含有 的 评估 顺序 ， 至 少 对 于 这 一 调用 要 如 此 。 没 
有 关于 调用 的 可 能 副作用 的 相关 知识 ， 编 译 器 不 能 在 这 一 调用 周围 移动 引用 。 编 译 器 必须 假设 最 坏 的 情 
况 : 函数 既 修改 又 使 用 它 可 以 存 取 的 每 一 个 变量 。 改 进 上 述 的 最 坏 情况 的 愿望 促进 了 过 程 间 分 析 领域 的 
很 多 工作 (参见 9.4.2 节 )。 


7.3.4 其 他 算术 操作 符 


为 了 处 理 其 他 算术 操作 ， 我 们 可 以 扩展 我 们 的 简单 模型 。 基 础 方案 保持 不 变 : 把 操作 数 放 入 寄存 器 
中 ， 执 行 操作 并 在 有 必要 的 情况 下 存储 结果 。 编 人 表达 式 文 法 中 的 优先 度 确 保 这 一 预定 的 顺序 。 诸 如 一 
元 减 等 的 一 元 操作 符 评估 它们 惟一 的 子 树 ， 然 后 执行 这 一 特定 的 操作 (指针 的 解除 引用 操作 的 行为 也 是 
如 此 )。 某 些 操 作 符 对 它们 的 实现 需要 复杂 的 代码 序列 (例如 ， 求 里 、 三 角 函 数 和 简 缩 操作 符 。) 这 些 也 
可 能 直接 展开 成 直线 式 布局 ， 或 者 被 处 理 为 对 编译 器 或 操作 系统 所 提供 的 库 例 程 的 一 个 函数 调用 。 


7.3.5 混合 型 表达 式 


许多 程序 设计 语言 所 接受 的 一 个 复杂 性 是 带 有 不 同类 型 操作 数 的 操作 。( 在 这 里 ， 我 们 主要 关心 的 
是 源 语言 中 基 类 型 的 操作 ， 而 不 是 程序 员 定义 的 类 型 。) 如 4.2 节 所 述 ， 编 译 器 必须 识别 这 一 情况 并 插入 
每 个 操作 符 的 换算 表 所 需要 的 变换 代码 。 这 一 般 包 括 把 一 个 或 两 个 操作 数 转换 成 更 一 般 的 类 型 并 在 这 更 
一 般 的 类 型 中 执行 操作 。 消 耗 结果 值 的 操作 可 能 需要 把 结果 转换 成 另外 一 种 类 型 。 

有 些 机 器 提供 直接 执行 这 些 转换 的 指令 ; 而 另外 一 些 机 器 却 希 望 编译 器 生成 复杂 而 与 机 器 相关 的 代 
码 。 无 论 在 哪 种 情况 下 ， 编 译 器 设计 者 都 要 在 IR 中 提供 转换 操作 符 。 这 样 的 操作 符 压缩 封装 所 有 的 转换 
细节 ， 包 括 任意 的 控制 流 ， 而 且 让 编译 器 负责 统一 优化 它 。 因 此 ， 代 码 的 动作 可 以 在 不 关心 循环 的 内 部 
控制 流 的 情况 下 把 不 变 的 转换 移出 该 循环 。 

一 般 地 ， 程 序 设计 语言 的 定义 为 每 一 个 转换 规定 一 个 特殊 的 公式 。 例 如 ， 在 FORTRAN 77 中 ,为 了 


-把 integer 转 换 成 comp1ex， 编 译 器 首先 把 integer 转 换 rea1。 编 译 器 把 结果 数 用 作 复 数 的 实 部 ， 并 把 虚 


部 设 为 real 的 0。 , 

对 于 用 户 定义 的 类 型 ， 编 译 器 没有 定义 每 个 特殊 情况 的 转换 表 。 然 而 ， 源 语言 仍 定义 表达 式 的 意义 。 
编译 器 的 任务 是 实现 那个 意义 ; 如 果 一 个 转换 是 不 合法 的 ， 那 么 这 个 转换 将 被 阻止 。 如 第 4 章 所 述 ， 很 
多 不 合法 转换 将 会 被 发 现 ， 并 在 编译 时 被 阻止 。 当 编译 时 检测 或 者 是 不 可 能 的 或 者 是 不 完整 的 时 候 ， 编 
译 器 应 该 生成 测试 这 些 不 合法 情况 的 运行 时 检测 。 当 代码 尝试 一 个 不 合法 转换 时 ， 这 一 运行 时 检测 将 会 
引发 一 个 运行 时 错误 。 


7.3.6 作为 操作 符 的 赋值 


大 多 数 类 Algol 语 言 实现 满足 下 面 简单 规则 的 赋值 : 
1) 评估 一 个 赋值 的 右 侧 。 
2) 评估 一 个 赋值 的 左 侧 。 
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3) 把 右 侧 值 移 到 由 左 侧 值 所 指定 的 位 置 。 

因此 ， 在 诸如 x<-_y 的 语句 中 ， 对 两 个 表达 式 x 和 y 进 行 不 同 的 评估 。 因 为 y 出 现在 赋值 操作 符 的 右 侧 ， 
它 被 评估 以 产生 一 个 值 ; 如 果 y 是 一 个 整 型 变量 ， 那 么 该 值 就 是 一 个 整数 。 因 为 x 在 赋值 操作 符 的 左 侧 ， 
它 被 评估 以 产生 一 个 位 置 ; 如 果 x 是 一 个 整 型 变量 ， 那 么 该 值 就 是 一 个 整数 的 位 置 。 这 个 位 置 可 能 是 一 
个 内 存 地 址 ， 或 者 是 一 个 寄存 器 。 为 了 区 分 这 两 种 评估 模式 ， 我 们 有 时 称 一 个 赋值 的 右 侧 的 评估 结果 为 
右 值 (rvalue)， 而 一 个 赋值 左 侧 的 评估 结果 称 之 为 左 值 (lvalue)。 

赋值 可 以 包含 指定 与 右 值 类 型 不 同 的 位 置 的 左 值 。 根 据 这 一 类 型 ， 或 者 需要 一 个 转换 ， 或 者 发 生 一 
个 类 型 错误 。 对 于 转换 ， 典 型 的 源 语言 规则 让 编译 器 评估 这 个 右 值 到 它 的 自然 类 型 ， 即 没有 赋值 上 下 文 
时 生成 的 类 型 。 然 后 ， 那 个 值 被 转换 到 由 这 个 左 值 命名 的 位 置 的 类 型 ， 并 被 存储 在 适当 的 位 置 上 。 


7.3.7 交换 性 、 结 合 性 以 及 数 系 


编译 器 通常 可 以 利用 各 操作 符 的 代数 性 质 。 加 法 和 乘法 满足 交换 律 和 结合 律 ， 布 尔 代数 操作 符 也 同 
样 。 因 此 ， 如 果 编 译 器 看 到 一 个 计算 x+y 的 代码 片段 ， 然 后 在 不 插入 对 x 或 y 的 赋值 的 前 提 下 计算 y+tx， 那 
么 编译 器 知道 它们 计算 同一 个 值 。 同 样 地 ， 如 果 编 译 器 看 到 表达 式 x+y+tz 和 w+x+y， 那 么 它 应 该 知道 x+y 
是 一 个 共同 的 子 表 达 式 。 如 果 它 用 严格 按 从 左 到 右 顺 序 评 估 这 两 个 表达 式 ， 那 么 它 无 法 识别 这 个 公共 子 
表达 式 ， 因 为 对 于 第 二 个 表达 式 ， 它 将 先 计 算 w+x， 然 后 计算 wtx+y。 

编译 器 应 该 利用 交换 律 和 结合 律 来 改进 编译 器 生成 的 代码 的 质量 。 对 表达 式 的 计算 进行 重 排序 可 以 
暴露 出 很 多 额外 的 转换 机 会 。 然 而 ， 重 要 的 警告 就 是 顺序 。 


由 于 精度 上 的 限制 ， 计 算 机 上 的 浮 点 数 只 代表 实数 的 一 个 子 集 ， 而 且 浮 点 操作 不 保持 结合 
性 。 因 此 ， 编 译 器 不 应 该 对 浮 点 计算 重 排序 ， 除 非 语言 定义 特别 允许 它 那 样 做 。 


考虑 下 面 的 例子 。 我 们 可 以 给 x、y 和 z 赋 浮 点 值 使 得 x、y <z、z~x=z、z-y=z， 但 是 z-(X+y)#zZ。 


在 这 样 的 情况 下 ， 这 一 结果 依赖 于 评估 顺序 。 计 算 〈z-x)-y 产 生 一 个 等 于 z 的 结果 ， 而 先 评估 x+y 并 从 z 
中 减 去 刚才 的 评估 值 产生 一 个 不 同 于 z 的 结果 。 

这 一 问题 是 由 于 浮 点 数 的 近似 性 质 造成 的 ;相对 于 指数 的 范围 来 说 尾数 较 小 。 为 了 相 加 两 个 数 ， 硬 
件 必 须 把 这 两 个 数 规格 化 ; 如 果 指 数 的 差异 比 尾数 的 精度 大 ， 那 么 较 小 的 数 将 被 截 短 到 零 。 围 绕 这 一 问 
题 ， 编 译 器 不 能 容易 地 按 它 的 方式 工作 。 因 此 ， 编 译 器 应 该 注意 这 一 警告 ， 并 避免 对 浮 点 计算 重 排序 。 


7.4 布尔 操作 符 和 关系 操作 符 


大 多 数 程 序 设计 语言 在 比 数 更 丰富 的 值 集 上 进行 操作 。 通 常 ， 包 括 布尔 操作 符 和 关系 操作 符 ， 这 二 
者 都 将 产生 布尔 值 。 因 为 大 多 数 程序 设计 语言 有 产生 布尔 值 的 关系 操作 符 ， 我 们 把 布尔 操作 符 和 关系 操 
作 符 放 到 一 起 考虑 。 布 尔 表达 式 和 关系 表达 式 的 一 般 应 用 是 改变 程序 的 控制 流 。 现 代 程 序 设计 语言 的 大 
部 分 能 力 都 得 自 于 计算 和 测试 这 样 的 值 的 能 力 。 

为 了 引入 布尔 值 ， 语 言 设计 者 们 在 标准 表达 式 文法 中 加 入 若干 产生 式 ， 如 图 7-3 所 示 。( 我 们 使 用 符 
号 ~ 表示 非 (not)， 用 人 表示 与 (and)， 用 V 表示 或 (or)， 从 而 避免 与 相应 ILOC 操 作 产生 混 斌 . ) 而 编 
译 器 必须 决定 如 何 表示 这 些 值 以 及 如 何 计 算 它 们 。 对 于 算术 表达 式 ， 这 样 的 设计 决策 很 大 程度 上 由 目标 
机 器 的 体系 结构 来 规定 ， 目 标 机 器 的 体系 结构 提供 数 的 格式 和 执行 基础 算术 的 指令 。 

幸运 的 是 ， 处 理 器 设计 师 似 乎 对 如 何 支 持 算术 已 达成 相当 广泛 的 共识 。 同 样 地 ， 大 多 数 体系 结构 提 
供 丰 富 的 布尔 操作 。 然 而 ， 对 关系 操作 符 的 支持 在 各 体系 结构 之 间 却 有 很 大 的 不 同 。 编 译 器 设计 者 必须 
使 用 适当 的 评估 策略 ， 使 得 语言 的 需求 与 可 用 的 指令 集合 相 匹配 。 


Ww 
N 
pa 
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- OrTerm 
OrTerm 
OrTerm v AndTerm 


AndTerm 
AndTerm ^ Bool NumExpr — NumExpr + Term 


Bool NumExpr — Term 
RelExpr Term 


RelExpr > NumExpr 
RelExpr > NumExpr 
NumExpr 


true Term x Factor 
false Term + Factor 
Factor 

( Expr ) 

num 

ident 


RelExpr < NumExpr 
RelExpr < NumExpr 
RelExpr = NumExpr 
RelExpr 4 NumExpr 








图 7-3 把 布尔 操作 和 关系 操作 加 入 表达 式 文法 中 
7.41 表示 


传统 上 ， 有 两 种 布尔 值 的 表示 : 数 编码 和 位 置 编码 。 前 者 对 true 和 false 赋 特殊 值 ， 并 使 用 目标 机 
器 的 算术 和 逮 辑 操作 来 处 理 它们 。 后 者 的 方法 把 表达 式 的 值 编码 为 可 执行 代码 中 的 一 个 位 置 。 它 使 用 比 
较 和 条 件 分 支 来 评估 这 一 表达 式 ; 不 同 的 控制 流 路 径 代表 这 一 评估 的 结果 。 每 一 个 方法 对 一 些 例子 适用 ， 
但 是 对 另外 一 些 例子 不 适用 。 ` ` 

1. 数 编码 

当 程 序 把 一 个 布尔 操作 或 关系 操作 的 结果 存储 到 一 个 变量 时 ， 编 译 器 必须 保证 这 个 值 有 一 个 具体 的 
表示 。 编 译 器 设计 者 必须 把 数值 赋 给 true 和 false， 使 得 能 很 好 地 工作 于 诸如 与 、 或 和 非 等 硬件 操作 。 
典型 的 是 把 0 赋 给 false ， 而 把 1 或 一 个 (false) MAtrue. 

例如 ， 如 果 b、c 和 d 都 在 寄存 器 内 ， 编 译 器 将 为 表达 式 b Vc 人 =-d 生 成 如 下 的 代码 : 

not ra > ñ 


and resi > M 
or fbr: > "3 


对 于 一 个 如 Xx<y 的 比较 ， 编 译 器 必须 生成 比较 x 和 y， 并 把 适当 的 值 赋 给 比较 结果 的 代码 。 如 果 目 标 机 器 
支持 一 个 返回 布尔 值 的 比较 操作 的 话 ， 那 么 下 面 的 代码 是 显然 的 : 


cmp-LT ry, Ty > Ty 


另 一 方面 ， 如 果 比 较 定 义 一 个 需要 读 取 并 进行 条 件 分 支 的 条 件 代 码 ， 那 么 结果 代码 更 长 、 更 复杂 9 这 
一 比较 的 风格 导致 Xx<y 的 一 个 较 混 乱 的 实现 。 


comp ry, ry = Cel 

cbr_LT cc, 一 Li,le 
Li: loadI true = r? 

jump! -> l; 


© ILOC 在 这 一 点 上 比较 灵活 。 它 包含 返回 布尔 的 比较 ， 例 如 例子 中 的 cmp_LT。 它 包含 返回 条 件 代码 的 比较 
comp 和 一 组 条 件 分 支 操作 符 ， 如 cbr-LT。 条 件 分 支 操作 符 解释 条 件 代码 (参见 A.5.1 节 )。 
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L2: loadl false > rz 
jump! > Ls 
Lz: nop 


使 用 条 件 代码 操作 实现 x<y 需 要 的 操作 次 数 比 使 用 返回 布尔 值 的 比较 所 需 的 操作 次 数 更 多 。 

2. 位 置 编码 

在 前 面 的 例子 中 ,Li 处 的 代码 创建 值 true ， 而 L: 处 的 代码 创建 值 fa1se。 在 其 中 的 每 一 个 点 处 ， 值 
既是 固定 的 又 是 已 知 的 。 在 某 些 情况 下 ， 代 码 不 必 为 表达 式 的 结果 生成 一 个 具体 的 值 。 相 反 ， 编 译 器 可 
以 在 一 个 位 置 即 代码 中 的 位 置 ， 例 如 Li， 对 值 进行 编码 。 

图 7-4 给 出 树 遍 历代 码 生 成 器 为 表达 式 a<bVvVc<dAe<f 发 行 的 代码 。 这 一 代码 评估 三 个 子 表达 式 
a<b、c<d 和 e <f， 并 使 用 布尔 操作 把 评估 结果 值 组 合 起 来 。 遗 憾 的 是 ， 这 生成 每 个 路 径 都 有 11 个 操 
作 的 操作 序列 ， 包 括 三 个 分 支 和 三 个 跳 转 。 


ras Th > cG //a<b 
cc) > Lisl 

true > 六 

一 L3 

false > r 

<> Ls 

Tos Ta Ce //c<d 
CC2 一 Lss Ls 

true >r 

一 Le 

false = r 

=> Le 


res rr => Ce //e<f 
CC3 一 L7 ,La 


true > r; 
+ Lo 
false > r; 
一 Lg 


=> 4 





=> rs 


图 7-4 a<bvc<dAe<f 的 原始 编码 


使 用 true 和 fa1se 表 示 子 表达 式 的 决策 导致 这 一 代码 的 某 些 复杂 性 。 以 短路 评估 使 用 位 置 编码 可 以 
导致 简单 得 多 的 操作 序列 ， 如 图 7-5 所 示 。 代 码 的 这 一 版 本 只 给 最 终 的 表达 式 生 成 一 个 值 ， 并 把 这 个 值 
留 在 rs 中 。 子 表达 式 的 值 被 当 作 位 置 编 入 代码 中 。: l 

直到 一 个 操作 需要 一 个 值 ， 位 置 编码 避免 对 表达 式 赋 实际 值 。 例 如 ， 把 结果 赋 给 一 个 变量 迫使 代码 
提供 具体 的 值 。 位 置 编码 在 代码 的 控制 流 路 径 中 隐 式 地 表示 表达 式 的 值 。 这 通常 导致 执行 较 少 操作 的 更 
简洁 的 代码 。 这 对 于 带 有 使 用 条 件 代 码 的 指令 集 来 说 更 值得 注意 ， 如 前 所 示 。 

如 果 表达 式 的 结果 从 不 被 存储 ， 那 么 位 置 编码 有 意义 。 当 代码 使 用 表达 式 的 结果 来 决定 控制 流 肝 ， 
位 置 编码 通常 可 以 避免 无 关 的 操作 。 例 如 ， 在 下 面 的 代码 片段 中 
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comp Yas Th = CC) 
cbr-LT cc, 一 bazl 
: Comp re, Ta > CCz 
cbr_LT ccz — Lzs Ls 
: Comp re, Tr => CC3 
cbr_LT cc3 一 L3:,L4 


: loadl true > rs 
jumpl 一 Ls 
: loadI false > rs 
jump! 一 bs 
: nop 





图 7-5 a<bvc<dAe<f 的 短路 评估 位 置 编码 


if (x<y) 
then statement, 
else statement, 
x<y 的 惟一 用 途 就 是 来 决定 是 执行 starement 还 是 执行 statement,。 为 X<y 产 生 一 个 显 式 值 没 有 意义 ， 除 


非 这 个 值 可 使 控制 流 更 有 效 。 

在 一 台 编 译 器 必须 使 用 比较 和 分 支 产 生 值 的 机 器 上 ，、 编 译 器 可 以 简单 地 把 statement/ 和 statement, 的 
代码 分 别 放置 在 编译 器 将 分 别 赋值 到 true 和 false 的 位 置 上 。 这 样 的 位 置 编码 的 使 用 导致 比 使 用 数 编码 ” 
更 简单 且 更 快 的 代码 。 

comp mm 一 cc //x<y 
cbr LT cc, 一 Li,Lz 

Li: code for statement, 

jump! + Le 

Le: code for statement, 

jump! — Le 

Le: nop 


这 里 ， 评 估 x <y 的 代码 已 与 在 statement, 和 statement, 之 间 的 选择 代码 结合 到 一 起 。 这 一 代码 把 x <y 的 结 
果 表 示 成 一 个 位 置 : 或 者 是 上 或 者 是 La。 

3. 短路 评估 

在 很 多 情况 下 ， 子 表达 式 的 评估 决定 整个 表达 式 的 值 。 例 如 ， 在 表达 式 a<bVc<dAe<f 中 ， 如 果 
a< b 则 这 一 表达 式 的 剩余 部 分 的 值 就 不 再 重要 了 。 同 样 地 ， 如 果 同 时 有 a> b 和 c> 4， 则 e <f 的 值 就 不 再 
重要 了 。 图 7-5 的 代码 使 用 这 上 面 这 些 事实 。 如 果 a<b， 那 么 代码 直接 分 支 到 产生 这 一 表达 式 的 值 true 
的 语句 序列 。 

这 一 改进 布尔 表达 式 和 关系 表达 式 的 评估 方法 称 为 短路 评估 (short-circuit evaluation ) 。 在 短路 评估 
中 ， 代 码 只 评估 决定 最 终 值 所 需 的 表达 式 部 分 ， 不 做 多 余 的 评估 。 短 路 评估 依赖 于 两 个 布尔 等 式 : 


Vx, false A x = false 
Vx, true V x = true 
短路 评估 可 以 通过 考虑 表达 式 中 操作 数 的 运行 时 值 降低 评估 表达 式 的 代价 。 
某 些 程序 设计 语言 ， 例 如 C 语 言 ， 要 求 编译 器 使 用 短路 评估 。 例 如 ，C 语 言 中 的 表达 式 
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(x != 0 && y/x > 0.001) 


依赖 于 短路 评估 来 保证 它 的 安全 性 。 如 果 x 是 0， 那 么 y/x 无 定义 。 显 然 ， 程 序 员 想 要 避免 由 于 除数 为 零 
而 引发 的 硬件 异常 情况 。 语 言 定 义 要 求 : 如 果 x 有 值 0， 则 代码 将 不 执行 除法 。 


7.4.2 关系 操作 的 硬件 支持 


目标 机 器 的 指令 集合 中 特定 的 低级 细节 对 于 关系 值 表 示 的 选择 有 着 重要 的 影响 。 特 别 地 ， 编 译 器 设 
计 者 必须 格外 小 心地 对 待 条 件 代码 、 比 较 操作 和 条 件 移动 操作 的 处 理 ， 因 为 这 些 操作 对 不 同 表示 的 相对 
代价 有 着 重要 的 影响 。 我 们 将 考虑 支持 关系 表达 式 的 四 个 方案 : 直线 条 件 代 码 、 增 设 条 件 移动 操作 的 条 
件 代码 、 取 布尔 值 的 比较 以 及 谓词 操作 。 上 述 每 一 种 方案 都 是 实际 实现 的 理想 版 本 。 

图 7-6 给 出 两 个 源 代 码 级 的 结构 和 在 上 述 四 个 方案 下 的 各 自 的 实现 。 图 的 上 半 部 分 给 出 控制 一 对 简 
单 赋值 语句 的 if-then-e1se。 而 下 半 部 分 给 出 一 个 布尔 值 的 赋值 。 


TE kcy) 
thena+ct+d 
else af 人 e+f 

comp rxsry => CC) 
cbr_LT cc; 一 Li,le cbr Ti > Like 
: add Feri Pa : add eifa rs 
jump! 一 Lout jump! 一 Lout 
: add re,rt = ra : add Peste > Va 
jump! 一 Lout jump! 一 Lout 


cmp-LT rx,ry > ri 


: nop 


直线 条 件 代码 


Comp rxsry => cc) 
add Tost => r 
add reyrf > 
i2i LT cclyriyrz => ma 


条 件 移动 


a) 


comp Yas Th => CC) 

cbr_LT CC1 — Lyle 
: comp Yc, Tq = CC2 

cbr_LT CC2 =% L3, L2 
: loadI false = rx 


: nop 


布尔 比较 


cmp_LT rx,ry > ml 
not ri => rz 
(ri)? add Fesda => Ta 
(r2)? add Test => Ta 


谓词 执行 


cmp_LT ra, Tp > ri 
cmp_LT Fes Ty => T 





jump! > ly and sory, Yo > mx 
: loadl true = rx ‘ 
jump! > Ll 
: nop 
直线 条 件 代码 布尔 比较 
comp ra,rb => cc} 
i2i LT cclyrTyrF > ml ”cmp_LT ra, rp > r) 
comp rc,rg => CC2 cmp_LT rc, ra => r2 
i2i_LT CC2,rr, rF > rz and Tis To => Vy 
and T1502 => rx 
条 件 移动 谓词 执行 
b) 328 
l 
329 


图 7-6 实现 布尔 操作 符 和 关系 操作 符 
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1. 直线 条 件 代码 
在 这 一 方案 中 ， 比 较 操 作 设置 一 个 条 件 代码 寄存 器 。 解 释 这 一 条 件 代 码 的 惟一 指令 是 条 件 分 支 ， 它 
有 在 六 个 关系 (小 于 ( < )、 小 于 等 于 (< )、 等 于 (= )、 大 于 等 于 (> )、 大 于 (> )、 不 等 于 (**)) 


上 分 支 的 变形 。 对 于 不 同类 型 的 操作 数 ， 这 些 指令 可 能 存在 若干 变形 。 

编译 器 必须 使 用 条 件 分 支 来 解释 条 件 代码 的 值 。 如 果 其 结果 的 惟一 使 用 是 决定 控制 流 ， 如 图 7-6a 所 
示 ， 那 么 编译 器 用 来 读 取 这 一 条 件 代 码 的 条 件 分 支 通 常 也 可 以 实现 源 代码 级 别 控制 流 的 结构 。 如 果 结 果 
被 用 于 布尔 操作 中 ， 或 者 被 保存 在 一 个 变量 中 ， 如 图 7-6b 所 示 ， 那 么 代码 必须 把 这 个 结果 转换 成 具体 的 
布尔 表示 。 图 7-6b 中 的 两 个 1oadI 操 作 就 是 做 这 一 工作 的 。 无 论 哪 种 情况 ， 代 码 对 于 每 一 个 关系 操作 符 
至 少 有 一 个 条 件 分 支 。 ' 

条 件 代码 之 所 以 强大 是 因为 处 理 器 通常 具有 实现 附属 条 件 代码 这 一 特性 。 一般 情况 下 ， 这 些 处 理 器 
上 的 算术 操作 设置 一 个 条 件 代码 来 反映 它们 的 计算 结果 。 如 果 编 译 器 可 以 为 必须 执行 的 算术 操作 适当 地 
设置 条 件 代 码 ， 那 么 就 可 以 省 略 比 较 操 作 。 因 此 ， 这 一 体系 结构 风格 的 倡导 者 们 认为 ， 这 一 方案 允许 程 
序 的 更 高 效 编码 ， 代 码 执 行 的 指令 数 小 于 把 布尔 值 放 入 通用 寄存 器 的 比较 器 所 执行 的 指令 数 。 


作为 优化 的 短路 评估 
短路 评估 的 诱因 是 布尔 表达 式 和 关系 表达 式 的 值 的 位 置 编码 。 在 使 用 条 代码 来 记录 比较 结果 并 | 


使 用 条 件 分 支 来 解释 条 件 代码 的 处 理 器 上 ， 短 路 评估 是 有 意义 的 。 
当 处 理 器 包含 诸如 条 件 移动 、 取 布尔 值 的 比较 和 谓词 执行 等 特性 时 ， 短 路 评估 的 优势 就 还 色 多 | 


了 。 随 着 分 支 等 待 的 增长 ， 短 路 评估 所 需 的 条 件 分 支 的 代价 也 相应 增长 。 当 分 支 的 代价 超过 避免 评 | 
估 所 节省 下 来 的 代价 上 时， 短路 评估 将 不 再 有 意义 。 相 反 ， 全 评估 将 更 快 。 

当 某 些 程序 设计 语言 需要 短路 评估 时 ， 如 C 语 言 ， 编 译 器 也 许 需要 执行 某 些 分 析 来 决定 何 时 可 | 
以 安全 地 用 全 评估 取代 短路 评估 。 因 此 ， 未 来 的 C 语 言 编译 器 也 许 要 包含 用 全 评估 取代 短路 评估 的 








2. 条 件 移动 
这 一 方案 把 条 件 移动 指令 加 入 到 直线 条 件 代 码 模 型 中 。 在 ILOC 中 ， 条 件 移动 的 形式 如 下 所 示 。 


iZi LT Cci, rj, rk => mm 


RRC FLTC, BAr MR NAAT Ar ET 

条 件 移动 保留 使 用 条 件 代 码 的 主要 优势 ， 当 较 早 的 操作 已 设置 这 一 条 件 代码 时 ， 避 免 比 较 操 作 。 如 
图 7-6a 所 示 ， 条 件 移动 让 编译 器 使 用 分 支 编 码 简 单 的 条 件 操 作 。 这 里 ， 编 译 器 推断 评估 两 个 加 法 。 它 使 
用 条 件 移动 来 得 到 最 后 的 赋值 。 只 要 两 个 加 法 不 引发 异常 ， 这 样 做 就 是 安全 的 。 

如 果 编 译 器 在 寄存 器 中 有 真 值 和 假 值 ， 例 如 真 值 在 rt 中 而 假 值 在 rt 中， 那么 编译 器 可 以 使 用 条 件 移动 
把 条 件 代码 转换 成 布尔 值 。 图 7-6b 使 用 这 一 策略 。 它 比较 a 和 b 并 在 r! 中 创建 这 一 布尔 结果 。 它 计算 c<d 
的 布尔 值 并 把 结果 放 入 r;。 它 计算 rl 和 rz 的 逻辑 与 (and) 来 作为 最 后 结果 。 

我 们 可 以 期 望 条 件 移动 指令 在 一 个 循环 内 执行 。 这 样 ， 编 译 器 可 以 避 开 分 支 ， 而 条 件 移动 的 执行 速 
度 将 更 快 。 

3. 取 布 尔 值 的 比较 

这 一 方案 完全 避 开 条 件 代 码 。 比 较 操 作 或 者 在 通用 寄存 器 中 或 者 在 专用 的 布尔 寄存 器 中 返回 一 个 布 
尔 值 。 条 件 分 支取 这 个 结果 作为 决定 其 行为 的 一 个 参数 。 
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取 布 尔 值 的 比较 对 图 7-6a 没 有 帮助 。 图 7-6a 的 代码 等 价 于 直线 条 件 代码 方案 。 它 需要 比较 、 分 支 和 
跳 转 去 评估 if-then-e1se 结 构 。 

这 一 模型 的 优势 如 图 7-6b 所 示 。 与 条 件 移 动 一 样 ， 这 一 模型 无 需 分 支 就 可 以 评估 关系 操作 符 ， 如 
图 7-6b 中 的 例子 所 示 。 然 而 ， 它 不 需要 把 比较 结果 转换 成 布尔 值 。 对 本 例 来 说 ， 布 尔 值 和 关系 值 的 统 
一 表示 使 代码 更 紧凑 、 更 高 效 。 

这 一 模型 的 弱点 是 它 需 要 显 式 比 较 。 尽 管 条 件 代 码 模型 有 时 可 以 通过 利用 算术 操作 设 定 条 件 代 码 从 
而 避 开 比较 ， 但 是 取 布 尔 值 的 比较 模型 总 是 需要 显 式 比较 。 

4. 谓词 执行 

在 支持 谓词 执行 的 体系 结构 中 ， 某 些 (或 全 部 ) 操作 根据 取 布 尔 值 的 操作 数 的 值 来 决定 这 个 操作 是 
否 生效 ， 这 种 方法 称 为 谓词 执行 (predicated execution )。 这 种 技术 使 得 编译 器 在 很 多 情况 下 避 开 条 件 分 
支 。 在 ILOC 中 ， 在 谓词 指令 前 包含 一 个 谓词 表达 式 来 编写 这 一 谓词 指令 。 为 了 提醒 读者 这 是 谓词 ， 我 
们 把 谓词 放 在 一 个 括号 中 ， 并 在 其 后 面 附加 一 个 问号 。 例 如 


(r17)? add rayrb > re 


表示 当 且 仅 当 rw 包含 值 true 时 执行 的 加 法 操作 (r,tr,)。 

图 7-6a 中 的 例子 展示 谓词 执行 的 优势 。 这 一 代码 既 简 单 又 紧凑 。 它 生成 两 个 谓词 Pry 和 rz。 它 利 用 这 
两 个 谓词 控制 源 程序 结构 中 的 then 和 e1se 部 分 中 的 代码 。 对 于 图 7-6b 的 例子 ， 谓 词 生成 与 布尔 比较 方案 
相同 的 代码 。 

处 理 器 可 以 使 用 谓词 避 开 执行 操作 ， 它 也 可 以 执行 操作 并 使 用 谓词 避 开 赋值 操作 结果 。 只 要 空闲 的 
指令 不 产生 异常 ， 这 两 个 方法 之 间 的 差异 与 我 们 的 讨论 无 关 。 我 们 的 例子 展示 产生 谓词 和 它 的 补 所 需 的 
操作 。 为 了 避免 这 一 情况 ， 处 理 器 可 以 提供 定义 两 个 寄存 器 的 比较 ， 一 个 是 这 个 布尔 值 ， 另 一 个 是 这 个 
布尔 值 的 补 。 


7.4.3 选择 表示 


编译 器 设计 者 在 决定 何 时 使 用 这 些 表示 时 有 一 定 的 自由 度 。 这 一 决定 取决 于 硬件 对 比较 的 支持 、 分 
支 (特别 是 错误 预测 的 条 件 分 支 ) 的 代价 、 短 路 评估 的 愿望 以 及 周围 代码 对 结果 的 使 用 方式 。 

比较 图 7-6 中 的 四 个 实现 表明 这 些 方案 之 间 的 差异 。 考 虑 图 7-6a 中 的 1f-then-e1se 结 构 。 四 个 方案 
都 产生 相同 长 度 的 执行 路 径 ， 即 四 个 操作 。 如 果 分 支 中 断 执行 ， 那 么 分 支 方案 (最 上 面 的 方案 ) 的 执行 
需要 花 更 长 时 间 。 而 无 分 支 方案 (最 下 面 的 方案 ) 可 以 避 开 这 样 的 中 断 ; 它们 还 产生 更 简洁 的 代码 。 

图 7-6b 中 的 布尔 赋值 展示 比较 的 显示 结果 与 隐 式 结果 之 间 的 差异 。 条 件 代码 方案 ( 左 侧 的 方案 ) 需 
要 的 代码 比 布尔 比较 方案 ( 右 侧 的 方案 ) 需要 的 代码 更 多 。 这 一 赋值 需要 能 够 存储 于 r, 中 的 具体 表示 。 
直接 产生 这 样 的 表示 带 来 更 清晰 、 更 紧凑 的 代码 。 在 短路 评估 中 ， 谓 词 将 比 布尔 比较 产生 更 好 的 代码 。 


7.5 存储 和 存 取 数 组 


到 此 为 止 ， 我 们 一 直 假设 存储 在 内 存 中 的 变量 包含 标量 值 。 很 多 程序 需要 数组 或 类 似 的 结构 。 定 位 
和 引用 数组 的 元 素 所 需要 的 代码 惊人 的 复杂 。 本 节 给 出 在 内 存 中 布局 数组 的 若干 方案 ， 并 描述 每 个 方案 
为 数组 引用 生成 的 代码 。 


7.5.1 引用 向 量 元 素 
数组 的 最 简单 形式 是 一 维 数组 ; 我 们 称 一 维 数组 为 向 重 〈vector)。 向 量 一 般 存 储 在 连续 的 内 存 中 ， 


we 
N 
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因此 第 ;个 元 素 位 于 第 ; + 1 个 元 素 的 直接 前 趋 位 置 。 因此 ， 向 量 Y[3.. .10] 生 成 下 面 的 内 存 布 局 ， 其 中 每 
个 单元 下 面 的 数字 表示 该 单元 在 向 量 中 的 下 标 : 
V[3...10] 


345678910 
ev 


当 编 译 器 遇 到 如 V[6] 这 样 的 引用 时 ， 它 必须 在 向 量 中 使 用 这 个 下 标 以 及 从 V 的 声明 所 得 的 事实 来 生成 
Y[6] 的 偏 移 量 。 然 后 ， 它 的 实际 地 址 被 计算 为 这 一 偏 移 量 和 指向 VY 的 开始 位 置 的 指针 的 和 ， 我 们 把 这 一 
指针 写作 @Y。 

作为 一 个 例子 ， 假 设 Y 被 声明 为 YEliow...high] ， 其 中 low 和 high 是 向 量 的 下 界 和 上 界 。 为 了 翻译 引用 
VY[i1] ， 编 译 器 既 需 要 一 个 指向 VY 的 存储 的 开始 位 置 的 指针 ， 又 需要 VY 中 元 素 1 的 偏 移 量 。 这 个 偏 移 量 是 
(1 一 low) xw， 其 中 w 是 V 的 单个 元 素 的 长 讼 。 因 此 ， 如 果 low 是 3，i 是 6 且 w 是 4， 那 么 元 素 i 的 偏 移 量 是 
(6 一 3) x 4=12。 假 设 ri 保存 i 的 值 ， 下 面 的 代码 片段 把 Y[i] 的 地 址 计算 到 r,， 并 把 值 装 入 到 Tr: 

1oadI @V => re // 获得 Vy 的 地 址 

subI r, 3 >r // ( 偏 移 量 -下 界 ) 

multI rl, 4 > r。 // * 元素 长 度 ，4 

add rer: > r3 // YL 让 的 地 址 

load rs => ry // YIi] 的 值 


注意 文本 上 的 简单 引用 V[i] 引 入 三 个 算术 操作 。 可 以 简化 和 改进 这 一 操作 序列 。 使 用 下 界 0 消去 减法 。 
如 果 w 是 2 的 笑 ， 乘 法 可 以 被 算术 移 位 取代 ; 实际 的 程序 设计 语言 中 的 很 多 基 类 型 都 有 这 一 性 质 。 对 地 址 
和 偏 移 量 求 和 似乎 是 无 法 避免 的 ; 也 许 这 正好 可 以 解释 为 什么 大 多 数 处 理 器 都 包含 取 基地 址 和 偏 移 量 的 


。 寻 址 模型 ， 并 在 基地 址 + 偏 移 量 处 存 取 这 个 位 置 。 在 ILOC 中 ， 我 们 把 这 个 操作 写作 1oadA0。 


1oadI @V = Yer // 获得 Y 的 地 址 
subI ri, 3 >r // RBE- TR) 
Ishiftl r, 2 > mz //* TRKE, 4 
loadAO re,r: > ry // YERE 


如 果 编 译 器 知道 Y 的 下 界 ， 那么 它 可 以 把 减 去 这 个 下 界 值 的 减法 县 入 @VY 中 。 我 们 不 使 用 eV 作为 Y 的 基 址 ， 
而 是 使 用 evy, = @V-low x w。 我 们 称 @V 是 V 的 伪 零 (false zero), 
v[3...10] 


ie eee 
eV, ev 


使 用 ev 并 假设 1 在 内， 存 取 V[i] 的 代码 变 成 : 


1oadI evo => revyo // 调整 y 的 地 址 
IshiftI rn, 2 or // x 元 素 长 度 , 4 
loadAO re@Vo, rl > ry //“[i] 的 值 


这 一 版 本 的 代码 更 短 ， 因 此 应 该 也 比较 快 。 在 手工 编码 的 汇编 程序 中 ， 这 最 后 的 序列 可 能 更 受 欢迎 。 在 
编译 器 中 ， 由 于 可 以 通过 揭示 诸如 乘法 和 加 法 的 细节 以 便 优化 ， 较 长 的 序列 可 能 产生 更 好 的 结果 。 诸 如 
把 乘法 转换 成 移 位 并 使 用 10adA0 重 写 add-10ad 序 列 等 低级 的 改进 可 以 在 编译 的 后 期 完成 。 

如 果 编 译 器 没有 可 用 的 数组 上 下 界 ， 那 么 它 可 能 在 运行 时 计算 数组 的 伪 零 ， 并 在 每 一 次 对 数组 的 引 
用 时 复 用 这 个 值 。 例 如 ， 编 译 器 可 以 在 多 次 引用 一 个 数组 元 素 的 过 程 的 入 口 处 计算 这 个 数组 的 伪 零 。 如 
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C 语 言 中 所 使 用 的 另外 一 个 策略 是 强制 使 用 0 作为 数组 的 下 界 。 这 使 得 eVo=eV 并 简化 所 有 的 数组 地 址 计算 。 
然而 ， 在 不 限制 程序 员 选 择 下 界 的 情况 下 ， 在 编译 器 中 对 细节 的 注意 也 可 以 达到 同样 的 结果 。 


7.5.2 数组 存储 布局 


存 取 多 维 数组 的 元 素 需 要 更 多 的 工作 。 在 讨论 编译 器 必须 生成 的 代码 序列 之 前 ， 我 们 必须 考虑 编译 
器 将 如 何 把 数组 下 标 映射 到 内 存 位 置 。 大 多 数 实现 使 用 下 面 三 个 方案 之 一 : 行 优先 顺序 、 列 优先 顺序 或 
间接 向 量 。 源 语言 定义 通常 指定 这 三 个 映射 中 的 一 个 。 

存 取 数组 元 素 所 需 的 代码 取决 于 数组 映射 到 内 存 的 方式 。 考 虑 数组 A[1. . .2，1. . .4]。 从 概念 上 ， 


它 的 样子 是 : 
a lull12l13l14| 
2,1 ]2,2]2,3]2,4| 
在 线性 代数 中 ， 一 个 二 维和 矩阵 的 行 (row) 是 它 的 第 一 维 ， 列 (column) 是 它 的 第 二 维 。 在 行 优先 
顺序 中 ，A 的 元 素 被 映射 到 连续 的 内 存 位 置 上 ， 使 得 每 一 行 的 相 邻 元 素 占据 连续 的 内 存 位 置 。 这 产生 下 
面 的 布局 : 


1) 12)1 114|2,1 |2,2[2,3 [2 
“PLY OBR RE SE AAT RSE NL PE Fe RY BG 
for i+ 1 to 2 
for je 1 to 4 
ACi,g] 二 Ai + 1 

在 行 优先 顺序 中 ， 赋 值 语句 按 顺 序 经 过 内 存 ， 开 始 于 A[1，1]，A[1，2]，A[1，3]， 直 到 A[2，4]。 
这 一 顺序 存 取 也 适用 于 大 多 数 内 存 层 次 。 把 1 循环 移 人 j 循 环 的 内 部 产生 在 行 之 间 跳 转 的 存 取 序 列 ， 它 依 
次 存 取 A[1，1]，A[2，1]，A[1，2]，…，A[2，4]。 对 于 像 A 这 样 的 小 数组 ， 这 不 是 问题 。 对 于 比 缓冲 
器 大 的 数组 ， 缺 乏 顺序 存 取 将 在 内 存 层 次 中 产生 拙劣 的 性 能 。 作 为 一 般 原则 ， 当 最 右 侧 的 下 标 〈 在 上 例 
中 的 j) 变化 最 快 时 ， 行 优先 顺序 产生 顺序 存 取 。 

相对 于 行 优先 顺序 的 是 列 优先 顺序 。 这 一 方式 保持 A 的 列 在 连续 的 位 置 上 ， 产 生 下 面 的 布局 : 


afer 1.222 lisla slalz) 


当 最 左 侧 的 下 标 变化 最 快 时 ， 列 优先 顺序 产生 顺序 存 取 。 在 我 们 的 双重 循环 做 套 中 ， 使 1 循环 在 外 侧 产 
生 非 顺序 存 取 ， 而 把 1 移 到 循环 的 内 侧 时 则 产生 顺序 存 取 。 、 

第 三 个 选择 不 是 一 目 了 然 的 ， 但 却 已 用 于 若干 语言 中 。 这 一 方案 使 用 间接 向 量 把 所 有 多 维 数组 压缩 
到 一 个 向 量 集合 。 对 于 我 们 的 数组 A， 这 一 方案 将 产生 下 面 的 布局 : 


外 村 aa 
| }~Pralzalesleal 


每 一 行 都 有 自身 的 连续 存储 。 在 一 行内 ， 元 素 同 向 量 一 样 寻 址 。 为 了 允许 行 向 量 的 系统 寻 址 ， 编 译 器 分 
配 一 个 指针 向 量 ， 并 适当 初始 化 这 一 指针 向 量 。 同 样 的 方案 可 以 创建 列 优先 间接 向 量 。 

这 一 方案 似乎 很 简单 ， 但 是 它 带 来 两 种 复杂 性 。 第 一 ， 较 之 简单 的 行 优先 或 列 优先 布局 ， 它 需要 更 
多 的 存储 。 每 一 个 数组 元 素 有 一 个 存储 位 置 ， 同 其 他 两 个 布局 一 样 ; 除 此 之 外 ,内 部 维 数 需要 间接 向 量 。 
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在 向 量 中 入口 的 数量 可 能 以 数组 维 数 的 平方 增加 。 图 7-7 给 出 更 复杂 的 数组 8B[1. . .2,1.. .3,1...4] 的 布 
局 。 第 二 ， 建 立 数组 内 部 维 数 的 所 有 指针 需要 大 量 的 初始 化 代码 。 





图 7-7 B[1...2,1...3,1...4] 的 列 优先 顺序 的 间接 向 量 


上 述 每 一 方案 已 用 于 现今 流行 的 程序 设计 语言 中 。 对 于 以 连续 存储 的 方式 存储 数组 的 语言 ， 行 优 
先 顺序 已 成 为 典型 的 选择 ， 一 个 著名 的 例外 是 FORTRAN ， 它 使 用 列 优先 顺序 。BCPL 和 Java 都 支持 间 
接 向 量 。 


7.5.3 引用 数组 元 素 


使 用 数组 的 程序 通常 包含 对 数组 的 各 个 元 素 的 引用 。 当 使 用 向 量 时 ， 编 译 器 必须 把 一 个 数组 引用 翻 
译 成 这 一 数组 存储 的 起 始 地 址 和 这 一 元 素 相对 于 这 一 起 始 地 址 的 偏 移 量 。 

本 节 描 述 在 行 优先 顺序 中 被 存储 为 连续 块 的 数组 的 地 址 计算 以 及 作为 间接 向 量 的 集合 的 数组 的 地 址 
计算 。 列 优先 顺序 的 相应 地 址 计算 也 遵循 与 上 述 行 优先 顺序 相同 的 基本 方案 , 只 是 维 数 的 顺序 反 过 来 了 。 
| Ba) 我们 把 这 一 部 分 留 给 读者 思考 。 

1. 行 优先 顺序 

在 行 优先 顺序 中 ， 地 址 计算 必须 寻找 行 的 开始 ， 然 后 在 这 一 行内 生成 一 个 偏 移 量 ， 就 如 同 它 是 一 个 
向 量 一 样 。 扩 展 用 于 挤 述 向 量 边界 的 表 记 法 ， 我 们 把 下 标 加 到 描述 各 维 的 ow 和 high 上 。 因 此 ，low, 指 的 
是 第 一 维 的 下 界 ， 而 highs 指 的 是 第 二 维 的 上 界 。 在 我 们 的 例子 A[1. . .2，1. . .4] 中 ，Iow 是 1 highs 是 4。 

HT ERICKA, jl, 编译 器 必须 发 行 计算 行 1 的 地 址 的 代码 并 计算 元 素 j 的 偏 移 量 ,由 7.5.1 节 可 知 ， 
这 一 偏 移 量 是 (j-low;) x w。 每 一 行 包含 4 个 元 素 ， 这 由 high, - low, + 1 计算 ， 其 中 high 是 最 高 列 ， 而 1ow， 
是 最 低 列 ， 即 它们 分 别 是 A 的 第 二 维 的 上 界 和 下 界 。 为 了 简化 说 明 ， 设 len,= high - lowi+ 1， 这 是 第 k 维 
的 长 度 。 因 为 行 是 被 连续 放置 的 ， 行 i 开始 于 距 A 的 开始 位 置 (i-low1) x len, x w 处 。 这 表明 地 址 计算 是 : 


@A + (i— lowi) x lenz x w + (j — low.) x w 
使 用 实际 值 取代 i、j、low;、high,、low; 和 w， 我 们 发 现 A[2，3] 位 于 距离 A[1，1] 偏 移 量 为 
(2—1)x(4-1+1)x4+(3-1)x4=24 
的 地 方 〈 假 设 @A 指 向 距 A[1 ，1] 偏 移 量 为 0 的 位 置 )。 考 虑 内 存 中 的 A， 我 们 发 现 AL1，1]+24 的 地 址 实际 
上 是 A[2，3] 的 地 址 。 
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在 向 量 的 情况 下 ， 当 编译 时 上 界 和 下 界 已 知 时 ， 我 们 可 以 简化 这 一 计算 。 运 用 相同 的 代数 创建 二 维 数组 
的 擅 零 产生 如 下 表达 式 : 


w 
W 
oo 


@A + (i x lena x w) ~ (low, x len, x w) + (j x w) — (low, x w), or 


@A + (i x lenz x w) + (j x w) — (low, x leng x w + low x w) 


上 述 表 达 式 的 最 后 一 项 (low x len x wtlow,xw) 独立 于 i 和 j， 所 以 这 最 后 一 项 可 以 直接 分 解 到 基地 址 
@Ao = @A — (low, x lena x w + low, x w)= 8A —20 
现在 ， 数 组 引用 只 是 
@hAo + i x lenn xw +j xw 
最 后 ， 我 们 可 以 重新 分 解 并 把 w 移 出 ， 节 省 一 个 额外 的 乘法 : 
@Ao + (i x lenz + j) x w 
对 于 A[2，3] 的 地 址 ， 这 评估 到 : 
@Ay + (2 x 4 +3) x 4=@Ay + 44 


因为 eAo 恰 好 是 @A-20， 这 等 价 于 @A-20+44=@A+24， 与 数组 地 址 多 项 式 的 原来 版 本 所 建立 的 地 址 相同 。 

如 果 我 们 假设 i 和 j 在 和 和 mm 内 ， 且 /em 是 一 个 常量 ， 那 么 这 种 多 项 式 导致 下 面 的 代码 序列 : 

load! @Ao => Tea, // 调整 A 的 基地 址 

multI ry, len 一 ri //i x len 

add rrj =m //+j 

mult] 2,4 >n // x 元 素 长 度 , 4 

loadAO rers = ra // ALi,j] 的 值 
在 这 一 形式 中 ， 我 们 已 把 计算 减少 到 两 个 乘法 和 两 个 加 法 (其 中 一 个 在 1oadA0 内 )。 第 二 个 乘法 可 以 重 
写成 移 位 。 

如 果 编 译 器 没有 存 取 数 组 的 边界 ， 那 么 它 必 须 或 者 在 运行 时 计算 伪 零 ， 或 者 使 用 更 复杂 的 包含 调整 
下 界 的 减法 的 多 项 式 。 如 果 数 组 元 素 在 一 个 过 程 中 被 存 取 多 次 ， 前 者 的 选择 可 能 更 有 益 ; 在 过 程 的 人口 ”39 
处 计算 人 擅 零 使 得 代码 可 以 使 用 代价 较 小 的 地 址 计算 。 仅 当 数组 不 常 被 存 取 时 ， 更 复杂 的 计算 才 有 意义 。 

二 维 数组 的 地 址 计算 背后 的 思想 可 以 推广 到 更 高 维 数组 。 以 列 优先 顺序 存储 的 数组 的 地 址 计算 可 以 
以 同样 的 方式 得 到 。 我 们 用 于 降低 地 址 计算 代价 的 优化 同样 也 可 用 于 其 他 种 类 的 数组 的 寻 址 多 项 式 上 。- 

2. 间接 向 量 

使 用 间接 向 量 简化 存 取 各 个 元 素 所 生成 的 代码 。 因 为 最 外 面 的 维 数 被 存储 为 一 组 向 量 ， 最 后 一 步 看 
似 7.5.1 节 中 所 描述 的 向 量 存 取 。 对 于 BL[i，j,k]， 最 后 一 步 计 算 距 离 k 的 偏 移 量 ， 最 外 维和 的 下 界 以 及 8 的 
元 素 的 长 度 。 初 始 的 几 步 可 以 通过 在 间接 向 量 的 结构 中 跟踪 适当 的 指针 得 到 这 一 向 量 的 起 始 地 址 。 

因此 ， 为 了 存 取 图 7-7 所 示 的 数组 8 的 元 素 BLi，j,，k]， 编 译 器 使 用 B、i 和 指针 的 长 度 来 寻找 对 应 于 
子 数组 BLi1，*，*] 的 向 量 。 接 下 来 ， 编 译 器 使 用 这 一 结果 、j 和 指针 长 度 来 寻找 对 应 于 子 数组 B[1，j，*] 
的 向 量 。 最 后 ， 编 译 器 使 用 下 标 k 的 向 量 地 址 计算 和 元 素 长 度 w 在 这 个 向 量 中 寻找 BLi，j,k] 的 地 址 。 

如 果 1、j 和 K 的 当前 值 分 别 在 寄存 器 r、ri 和 mr 内， 且 @8B" 是 第 一 维 的 零 调 整地 址 ， 那 么 BR[1，j，k] 
可 按 如 下 的 形式 引用 : 

load! @Bo = roso。 // BOYS 

multI m4 =r // 指针 为 4 字 节 
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1oadA0 reeusri => re // 获取 @B[ii,*,*] 


multI nr 4 srm // 指针 为 4 字 节 
loadAO rz,r3 = rą // 获取 @B[i,j,*] 


multI rx,4 全 rs // 指针 为 4 字 节 
loadAO rs,rs => re = // B[i,j,k] 的 值 
[340] ”这 一 代码 假设 在 间接 结构 中 的 指针 已 被 调整 到 非 零下 界 。 如 果 这 些 指针 没有 被 调整 ， 那 么 在 ri 和 mx 中 的 

值 必 须 对 应 于 相应 的 下 界 而 减少 。 在 这 一 例子 中 ， 可 以 用 移 位 取代 乘法 。 

使 用 间接 向 量 ， 引 用 恰好 对 每 一 维 需要 两 个 指令 。 这 一 性 质 使 得 对 于 内 存 存 取 相 对 于 算术 快捷 的 体 
系 来 说 ， 数 组 的 间接 向 量 实现 更 高 效 。 例 如 ，1985 年 之 前 的 大 多 数 计算 机 上 都 是 如 此 。 若 干 编译 器 使 用 
间接 向 量 来 操控 地 址 算术 的 代价 。 随 着 内 存 存 取 的 代价 相对 于 算术 的 增加 ， 这 一 方案 已 失去 了 它 的 优势 。 
如 果 系 统 再 一 次 呈现 相对 执行 算术 所 需要 的 时 间 内 存 等 待 较 小 的 话 ， 间 接 向 量 也 可 能 再 次 成 为 降低 存 取 
代价 的 一 种 实用 方法 。 

对 于 基于 高 速 缓冲 器 的 机 器 来 说 ， 局 部 化 对 性 能 是 至 关 重要 的 。 当 数组 变 得 比 高 速 缓冲 器 大 很 多 
的 上 时候， 存储 顺序 影响 局 部 化 。 行 优先 和 列 优先 存储 方案 为 某 些 基于 数组 的 操作 产生 良好 的 局 部 化 。 
没有 理由 相信 间接 向 量 也 产生 良好 的 空间 局 部 化 。 更 可 能 的 是 这 一 方案 生成 随机 出 现 的 对 内 存 系统 的 
引用 流 。 


3. 存 取 数组 值 参 数 

当 数 组 作为 参数 传递 时 ， 大 多 数 实现 通过 引用 来 传递 它 。 即 使 是 对 其 他 参数 都 使 用 值 调用 的 语言 中 ， 
数组 通常 也 是 通过 引用 传递 的 。 考 虑 值 传递 数组 所 需要 的 机 制 。 调 用 过 程 需要 把 数组 的 每 一 个 元 素 的 值 
拷贝 到 被 调用 过 程 的 活动 记录 中 。 作 为 引用 参数 传递 数组 可 以 大 幅度 降低 每 一 次 调用 的 代价 。 

如 果 编 译 器 要 在 被 调用 过 程 中 生成 一 个 数组 引用 ， 那 么 它 需 要 有 关 绑 定 到 这 一 参数 上 的 数组 的 维 数 
信息 。 例 如 ，FORTRAN 要 求 程序 员 在 声明 数组 时 使 用 常量 或 其 他 形 参 来 指定 该 数组 的 维 数 。 因 此 ， 
FORTRAN 责 成 程序 员 负 责 向 被 调用 过 程 传递 对 参数 数组 正确 寻 址 所 需 的 信息 。 

其 他 语言 则 把 收集 、 组 织 和 传递 必要 信息 的 任务 交 给 编译 器 。 如 果 数 组 的 大 小 不 能 静态 地 确定 ， 那 
么 这 一 方法 是 必要 的 ， 因 为 需要 在 运行 时 进行 分 配 。 即 使 当 数组 的 大 小 可 以 静态 地 确定 时 ， 这 一 方法 也 
是 有 用 的 ， 因 为 它 把 使 代码 混淆 的 细节 抽象 掉 。 在 这 些 环境 下 ， 编 译 器 构建 一 个 既 包含 指向 数组 开始 的 

41| ”指针 又 包含 每 一 维 的 必要 信息 的 描述 器 。 描 述 器 有 一 个 已 知 的 大 小 ， 即 使 数组 的 大 小 在 编译 时 不 可 知 时 
也 是 如 此 。 因 此 ， 编 译 器 可 以 在 被 调用 过 程 的 AR 中 为 描述 器 分 配 空 间 。 被 传递 到 数组 参数 槽 的 值 是 一 
个 指向 这 个 描述 器 的 指针 ， 这 一 指针 称 为 内 情 向 量 (dope vector). 

当 编 译 器 生成 一 个 对 作为 参数 传递 的 数组 的 引用 时 ， 它 必须 从 内 情 向 量 中 提取 信息 。 它 生成 的 地 址 
多 项 式 与 对 于 局 部 数组 引用 所 使 用 的 地 址 多 项 式 相 同 ， 只 是 必要 的 值 是 从 内 情 向 量 装 入 的 。 作 为 一 个 重 
要 的 方针 ， 编 译 器 必须 决定 它 将 使 用 的 地 址 多 项 式 的 形式 。 使 用 原始 的 地 址 多 项 式 ， 内 情 向 量 必须 包含 
一 个 指向 数组 开始 的 指针 、 每 一 维 的 下 界 以 及 除 一 个 维 之 外 的 所 有 维 的 大 小 。 使 用 基于 伪 零 的 地 址 多 项 
A, 下 界 的 信息 是 不 必要 的 。 只 要 编译 器 总 使 用 相同 形式 的 多 项 式 ， 它 可 以 作为 每 一 次 过 程 调用 的 序言 
来 生成 构建 内 情 向 量 的 代码 。 

一 个 给 定 的 过 程 可 以 从 很 多 调用 地 点 调用 ， 每 一 个 调用 传递 丰 同 的 数组 。 图 7-8 中 的 PL/I 过 程 main 包 
含 两 个 调用 fee 的 语句 。 第 一 语句 传递 数组 x， 而 第 二 个 语句 传递 数组 y。 在 fee 的 内 部 ， 实 参 (x 或 y) 被 
绑 定 到 形 参 A。 为 了 允许 fee 的 代码 引用 适当 的 位 置 ， 它 需要 A 的 内 情 向 量 。 各 自 的 内 情 向 量 如 此 图 的 右 
侧 所 示 ， 它 们 都 包含 伪 零 和 在 相应 调用 地 点 传递 的 数组 的 每 一 个 维 的 长 度 。 
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program main; 
begin; 
declare x(1:100,1:10,2:50), 
y(1:10,1:10,15:35) float; 


call fee(x) 
call fee(y); 
end main; 


procedure fee(A) 
declare A(*,*,*) float; 
begin; 
declare x float; 
declare i, j, k fixed binary; 


x= Afi Jk); 


end fee; 





图 7-8 内 情 向 量 


注意 ， 存 取 数 组 值 参数 的 代价 要 比 存 取 局 部 声明 的 数组 的 代价 大 。 最 好 的 情况 是 ， 内 情 向 量 引 入 额 
外 的 内 存 引 用 来 存 取 相 应 的 入 口 。 最 坏 的 情况 是 ， 内 情 向 量 阻止 编译 器 执行 依赖 于 完备 的 数组 声明 的 完 
整 知识 的 优化 。 


7.5.4 范围 检测 


大 多 数 程序 设计 语言 的 定义 都 显 式 或 隐 式 地 假设 程序 只 引用 在 数组 的 固定 边界 内 的 数组 元 素 。 根据 
定义 ， 引 用 界外 元 素 的 程序 不 是 形式 良好 的 。 某 些 语言 (例如 Java 和 Ada) 要 求 检查 并 报告 界外 存 取 。 
对 于 另外 一 些 语言 ， 很 多 编译 器 包含 检查 并 报告 界外 数组 存 取 的 机 制 。 

被 称 为 范围 检测 (range checking) 的 最 简单 实现 在 每 一 次 数组 引用 前 插入 一 个 检测 。 这 一 检测 核实 
每 一 个 下 标 值 都 落 入 它 被 使 用 的 维 的 有 效 范围 之 内 。 在 多 用 数组 的 程序 中 ， 这 样 的 检测 的 额外 开销 成 为 
重要 的 问题 。 对 于 这 一 简单 方案 可 以 做 很 多 改进 。 在 编译 器 中 ， 最 廉价 的 选择 是 证 明 给 定 的 引用 不 能 生 
成 界外 引用 。 

如 果 编 译 器 打算 为 数组 到 值 参数 插 人 一 个 范围 检测 ， 那么 编译 器 需要 在 内 情 向 量 中 包含 附加 的 信息 。 
例如 ， 如 果 编 译 器 使 用 基于 数组 的 伪 零 的 地 址 多 项 式 ， 那么 它 就 要 有 每 一 维 的 长 度 信息 ， 但 是 没有 上 界 
和 下 界 的 信息 。 它 可 以 通过 检测 相对 于 数组 总 长 的 偏 移 量 来 执行 不 精确 的 检测 。 然而 ， 为 了 执行 精确 的 
检测 ， 编 译 器 必须 在 内 情 向 量 中 包含 每 一 维 的 上 界 和 下 界 的 信息 ， 并 对 照 它 们 进行 检测 。 

当 编 译 器 为 范围 检测 生成 运行 时 代码 时 ， 它 插 人 很 多 这 一 代码 的 拷贝 来 报告 范围 外 的 下 标 。 这 一 般 
包括 到 运行 时 错误 例 程 的 分 支 。 在 正常 的 执行 期 间 ， 几乎 从 不 到 达 这 些 分 支 (特别 是 如 果 错 误 处 理 器 终 
止 执行 )。 如 果 目 标 机 器 让 编译 器 预测 这 一 分 支 的 可 能 方向 ， 那么 这 些 异 常 分 支 应 被 预测 为 不 执行 。 编 
译 器 也 许 要 利用 这 些 分 支 导致 非 正 常 终止 来 注释 它 的 IR。 从 而 允许 编译 器 的 后 续 阶段 区 分 “正常 执行 路 
径 ” 和 “错误 路 径 ”; 编译 器 可 能 能 够 使 用 这 一 路 径 的 差异 知识 产生 更 好 的 正常 路 径 代 码 。 


7.6 字符 串 


程序 设计 语言 为 字符 数据 提供 的 操作 不 同 于 为 数值 数据 提 拱 的 操作 。 程序 设计 语言 对 字符 串 的 支持 
级 别 的 范围 非常 之 广 ， 从 C 语 言 这 样 大 部 分 处 理 都 采用 对 库 例 程 的 调用 形式 ， 到 PL/I 这 样 把 字符 牛 赋 值 、 
形成 字符 串 的 任意 子 串 、 甚 至 是 串 连接 作为 第 一 类 操作 符 的 形式 。 为 了 表示 在 申 实 现 中 所 出 现 问题 ， 本 
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节 讨 论 串 赋值 、 串 连接 和 计算 串 长 度 的 实现 。 

串 操作 成 本 可 能 很 高 。 诸 如 IBM S/370T 和 DEC VAX 这 样 的 老式 CISC 体 系 结构 对 串 处 理 提供 广泛 的 
支持 。 现 代 RISC 机 器 更 加 依赖 于 编译 器 来 使 用 一 组 更 简单 的 操作 对 这 些 复杂 的 操作 进行 编码 。 从 一 个 位 
置 到 另 一 个 位 置 的 字 节 拷贝 的 基本 操作 出 现在 很 多 不 同 的 上 下 文中 。 


7.6.1 BARA 


编译 器 设计 者 必须 为 串 选择 一 个 表示 ; ARRA BR ER RA A BAA 

为 了 看 清 这 一 点 ， 考 虑 下 面 串 b 的 两 个 表示 。 左 边 的 表示 是 C 语 言 的 传统 现实 中 的 表示 。 它 使 用 简单 
的 字符 向 量 ， 并 用 特定 的 字符 ('\0’) 作为 结束 符 。 图 示 符 8 表示 一 个 空格 。 右 侧 的 表示 除了 存储 这 个 
串 之 外 还 存储 串 的 长 度 (8)。 很 多 语言 的 实现 使 用 这 种 方法 。 


alylsitirlilnloNol | Lelaly[sitlriiln|g) 
@b 8b 


空 结束 显 式 长 度 字段 


如 果 这 个 长 度 字段 占据 的 空间 比 空 结束 符 占据 的 空间 大 ， 那 么 存储 这 一 长 度 将 稍微 增加 内 存 中 串 的 
大 小 。( 我 们 的 例子 假设 这 一 长 度 是 4 个 字 节 ; 在 实践 中 ， 它 可 能 会 小 一 些 。) 然而 ， 存 储 这 一 长 度 可 以 
简化 串 上 的 若干 操作 。 如 果 一 种 语言 允许 可 变 长 度 的 串 存 储 在 被 分 配 固定 长 度 的 串 中 ， 那 么 实现 器 也 可 
能 存储 这 个 分 配 的 长 度 以 及 这 个 串 。 编 译 器 可 以 使 用 这 一 分 配 长 度 对 赋值 和 连接 做 运行 时 边界 检查 。 


7.6.2 RE 


串 赋值 在 概念 上 很 简单 。 在 C 语 言 中 ，b 的 第 三 个 字符 到 a 的 第 二 个 字符 的 赋值 可 以 编写 成 如 下 面 左 
边 所 示 的 形式 。 
loadI Gb = re 


a[1] = b[2]; cloadAI reb,2 > rz 
’ loadl @a = rea 


cstoreAl rz => reasl 


在 带 有 字符 尺度 内 存 操作 (cload 和 cstore) 的 机 器 上 ， 这 一 赋值 被 翻译 成 右边 所 示 的 简单 代码 。( 回想 ， 
a 的 第 一 个 字符 是 a[0] ， 因 为 C 语 言 使 用 零 作为 所 有 数组 的 下 界 . ) 

然而 ， 如 果 底 层 硬 件 不 支持 面向 字符 的 内 存 操 作 ， 那 么 编译 器 必须 生成 更 复杂 的 代码 。 假 设 a 和 b 开 
始 于 字 边界 ， 且 一 个 字符 占据 1 个 字 节 ， 一 个 字 占 据 4 个 字 节 ， 那 么 编译 器 会 发 行 下 面 的 代码 : 


loadI 8@b = ve // b 的 地 址 

Toad reb an // 获取 第 1 个 字 

andI rT1,0x0000FF00 = rz // 屏蔽 其 他 

1shiftI rz,8 >n // 将 其 移动 1 字 节 
load! @a = re // a 的 地 址 
load — Tea = ra // 获取 第 1 个 字 

and ras0xFFOOFFFF => rs // 屏蔽 第 ?个 字符 

or 13,05 => re // 放 入 新 的 第 2 个 字符 
store re => ra // 将 其 放 回 至 a 中 


这 一 代码 装 入 包含 b[2] 的 字 ， 提 取 这 个 字符 ， 把 这 个 字符 移 位 到 位 ， 再 把 它 屏蔽 到 包含 a[1] 的 字 中 的 正 
确 位 置 上 ， 然 后 将 这 一 结果 存储 回 到 应 该 放置 的 位 置 。( 这 一 代码 序列 所 增加 的 复杂 性 可 以 解释 为 什么 





代码 形态 


799 


面向 字符 的 装 入 和 存储 操作 再 次 变 得 通用 的 原因 。) | 
对 于 较 长 的 串 ， 代 码 是 类 似 的 。PL/I 有 串 赋 值 操作 符 。 程 序 员 可 以 编写 如 a=b 这 样 的 语句 ; 其 中 a 和 
b 已 被 声明 为 字符 串 。 假 设 编译 器 使 用 显 式 长 度 表 示 。 在 带 有 面向 字 节 的 10ad 和 store 操 作 的 机 器 上 ， 下 


面 简单 循环 将 完成 字符 串 的 移动 。 

load! @b => reb 
loadAI freb, 一 4 > ri 
loadI @a => Yea 
loadAI = reg, —4 => rz 
cmp_LT Yar, > rn 
cbr r3 一 Lsovs bi 

Lı: load! 0 => ra 

a = b; cmp-LT T4 > r5 

cbr r5 — Lz2,L3 

Le: cloadAO rests => re 
cstoreA0 rs => Yeasts 
addI Tal > Ty 
cmp_LT Yao) > 17 
cbr ry — Lz,L3 

L3: nop 


// 获取 b 的 长 度 


// 获取 a 的 长 度 

// b 能 否 装 入 a? 

// 引发 溢出 

// 计数 器 

// 是 否 需 要 更 多 的 拷贝 ? 


// 从 b 获 取 字 符 

// 将 其 置信 a 中 

// 递增 偏 移 

// 是 否 需 要 更 多 的 拷贝 ? 


// 下 一 个 语句 


注意 ， 这 一 代码 检测 a 和 b 的 长 度 以 避免 使 超 界 。 标 签 L,w 表 示 串 溢出 条 件 的 一 个 运行 时 错误 处 理 器 。 
在 带 有 空 结束 串 的 语言 中 ， 需 要 对 这 一 代码 做 某 种 程度 的 改变 。 考 虚 将 位 于 b 的 串 找 贝 到 位 于 a 的 捉 


的 简单 C 语 言 循环 。 


do { 
*att = *bt+; 
} while (*b != '\0') 


Li: 


Le: 


loadI @b = re // 获取 指针 
loadl @a => Tea 

loadI NULL > r // 结束 符 

cload ræ => r。 // 获取 下 一 个 字符 
cstore r2 => re // 存储 

addI resl > ræ // 取代 指针 

addI reas] = rea 

cmp.NE ris? > rs 

cbr ra 一 Li,Lz 

nop // 下 一 个 语句 


如 果 目 标 机 器 支持 10ad 和 store 操 作 上 的 自 增 ， 那么 上 述 循 环 中 的 两 个 add 可 以 在 c10ad 和 cstore 操 作 中 
执行 ， 而 这 将 把 这 一 循环 减少 到 四 个 操作 。( 回想 一 下 ，C 语 言 最 初 是 为 PDP/11 设 计 的 ， 而 PDP/11 支 持 
自动 后 置 增 量 。) 如 果 没 有 自 增 , 那么 编译 器 可 以 对 公共 偏 移 使 用 c10adA0 和 cstoreA0 来 生成 更 好 的 代码 。 
这 在 循环 中 只 需要 一 个 add 操 作 。( 注 意 这 一 代码 改变 re 和 re 的 值 。) 

如 果 没 有 面向 字 节 的 内 存 操作 ， 那 么 代码 将 变 得 更 加 复杂 。 编 译 器 将 用 早 前 给 出 的 在 循环 体内 屏蔽 
单一 字符 的 方案 来 取代 上 面 循环 体 中 的 1oad、store 和 add 部 分 。 取 代 后 的 结果 代码 是 可 用 的 ， 但 却 是 一 
个 很 不 美观 且 需 要 更 多 指令 才能 把 b 拷 到 a 的 循环 。 

另外 一 个 选择 是 采用 在 某 种 程度 上 更 复杂 的 方案 ， 这 一 方案 使 字 长 度 的 10ad 和 store 操 作成 为 一 个 
优势 而 不 是 负担 。 编 译 器 可 以 使 用 面向 字 的 循环 ， 后 面 跟 着 一 个 循环 后 清理 操作 ， 循 环 后 清理 操作 处 理 
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串 的 尾 端 所 剩余 的 字符 。 这 一 方案 如 图 7-9 所 示 。 


loadI @b => Ter 
1oadAI rep,—4 >r 获取 b 的 长 度 
load! @a => Tea 
loadAI rea,—4 = rz 获取 a 的 长 度 
cmp-LT = rash) > rs b 能 否 装 人 a? 
cbr r3 > LsovsLi 跳 转 到 错误 例 程 

: andI T1s0xFFFFFFFC => ra [length(b) +4] 
1oad1 0 = r5 BRAS RRS 
cmp_LT rsyr4 >r 是 否 需 要 更 多 循环 ? 
cbr ry 一 Lz,L3 

: loadAO = rebvrs => Te 从 b 获 取 一 个 字 
storeA0 re = reasr5 将 其 存储 到 a 中 
addI 5,4 => rs 递增 偏 移 
cmp_LT rs,r => re 是 否 需 要 更 多 循环 ? 
cbr rg = bz,L3 

: cmp_LT rssr > Tie 是 否 已 完成 ? 
cbr Tio 一 Labs 

: cloadAO  rea,ts © >u 获取 下 一 个 字符 
cstoreA0 ri => Tents 存储 下 一 个 字符 
addI r5,1 => rs 取代 偏 移 
cmp_LT rs,n > rl 是 否 已 完成 ? 


cbr Tz 一 L4 , Ls 


: nop . 下 一 个 语句 





图 7-9 使 用 全 字 操 作 的 串 赋 值 (a=b) 


图 7-9 的 代码 要 求 更 加 复杂 ， 因 为 它 必须 计算 可 以 使 用 字 操 作 移动 的 子 品 的 长 度 (Length (6)+4],9) 
这 一 循环 体 包含 五 个 指令 。 它 的 选 代 次 数 是 面向 字符 循环 所 使 用 的 迭代 次 数 的 四 分 之 一 。 

在 面向 字 循环 结束 之 后 ， 面 向 字符 循环 处 理 剩余 的 一 个 、 两 个 或 三 个 字符 。 当 然 ， 如 果 编 译 器 知道 
串 长 度 〈 并 且 知 道 它们 比较 短 ) ， 那 么 它 可 以 完全 避 开 生 成 循环 ， 取 而 代 之 的 是 发 行 10ad 和 store 的 正确 
序列 。 这 避免 这 一 循环 的 额外 开销 ， 但 是 可 能 生成 更 大 的 程序 。 

存在 更 复杂 的 情况 。 这 包括 含有 非 字 对 齐 的 串 或 子 申 ， 以 及 赋值 的 源头 和 目标 重 又 的 情况 。 面 向 字 
符 的 循环 一 般 在 这 些 情况 下 都 可 以 正确 地 工作 。 更 高 效 的 面向 字 的 循环 需要 额外 的 工作 ， 诸 如 为 了 到 达 
字 边 界 的 预 循环 ， 和 使 用 一 小 块 额外 的 空间 来 缓冲 字符 并 填充 源头 和 目标 中 不 同 的 排列 等 。 在 实践 中 ， 
很 多 编译 器 调用 一 个 优化 的 库 例 程 来 实现 这 些 非 平凡 的 情况 。 


7.6.3 FER 


连接 是 一 个 或 多 个 赋值 序列 的 速记 。 连 接 有 两 种 基本 形式 : 把 串 b 添 加 到 串 a 的 尾部 ; 创建 一 个 包含 
a 且 其 后 紧 跟 着 b 的 新 串 。 

前 一 种 情况 是 在 一 个 长 度 计算 之 后 跟着 一 个 赋值 。 编 译 器 发 行 确定 a 的 长 度 的 代码 。 如 果 空 间 允 许 ， 
那么 编译 器 接着 执行 b 到 紧 跟着 a 的 内 容 的 空间 的 一 个 拷贝 。( 如 果 设 有 足够 的 空间 ， 代 码 将 引发 一 个 运 


© 原 书 的 liength (b) * 4] 是 错 的 。 一 一 译 者 注 
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行 时 错误 。 ) 后 一 种 情况 要 求 拷贝 a 和 b 中 的 每 一 个 字符 。 编 译 器 把 这 种 连接 处 理 为 一 对 赋值 并 生成 如 前 


节 所 示 的 代码 。 

无 论 在 哪 种 情况 ， 编 译 器 将 保证 分 配 足够 的 空间 来 保存 结果 。 在 实践 中 ， 编 译 器 或 者 运行 时 系统 必 
须知 道 每 个 串 的 分 配 长 度 。 如 果 编 译 器 知道 这 些 长 度 ， 那 么 它 可 以 在 代码 生成 期 间 执行 检测 并 避 开 为 运 
行 时 检测 发 行 代 码 。 在 编译 器 不 知道 a 和 b 的 长 度 的 情况 下 ， 编 译 器 必须 生成 在 运行 时 计算 这 些 长 度 并 执 
行 适当 的 检测 和 分 支 的 代码 。 


7.6.4 RK 


处 理 串 的 程序 通常 需要 计算 字符 串 的 长 度 。 在 C 语 言 的 程序 中 ， 标 准 程序 库 中 的 函数 str1en 取 串 为 
参数 且 返 回 表 示 为 一 个 整数 的 串 的 长 度 。 在 PL/I 中 ， 内 置 函 数 1ength 完 成 相同 功能 。 前 节 所 述 的 两 种 串 
表示 将 为 串 长 度 计算 带 来 完全 不 同 的 代价 。 

(1) 空 结束 的 串 (null-terminated string) 

此 时 ， 长 度 计 算 必 须 开 始 于 串 的 开始 ， 并 依次 检查 每 一 个 字符 ， 直 到 达到 空 字 符 。 代 码 类 似 于 C 语 
言 的 字符 拷贝 循环 。 这 一 代码 需要 的 时 间 与 串 的 长 度 成 正比 。 

(2) 显 式 长 度 字段 (explicit length field) 

此 时 ， 长 度 计算 是 一 个 内 存 引 用 。 在 ILOC 中 ， 这 一 长 度 计算 变 成 把 这 个 串 的 起 始 地 址 装 入 一 个 寄 
存 器 的 10adI， 后 面 跟着 一 个 1oadAI 以 得 到 这 一 长 度 。 其 计算 成 本 是 常数 而 且 很 小 。 

这 些 表示 间 的 权衡 是 简单 的 。 空 结束 可 以 节省 少量 空间 ， 但 是 对 于 长 度 计算 需要 更 多 代码 和 更 长 时 
间 。 显 式 长 度 字段 对 每 一 个 串 的 代价 是 多 一 个 字 ， 但 是 可 以 使 长 度 计算 取 常 量 时 间 。 

串 优 化 问题 的 一 个 典型 例子 是 求 两 个 串 a 和 pb 的 连接 的 长 度 。 在 带 有 串 操作 符 的 语言 中 ， 这 可 以 写成 
length〈a+b)， 其 中 + 表示 串 的 连接 。 这 一 表达 式 有 两 个 显然 的 实现 : 构造 连接 结果 串 并 计算 其 长 度 
(在 C 语 言 中 是 strlen(strcat(a, b)))， 以 及 求 a 和 b 的 长 度 和 (在 C 语 言 中 是 strien(a)+strlien(b))。 
当然 ， 后 者 是 理想 的 。 使 用 显 式 长 度 字段 ， 这 一 操作 可 以 优化 成 使 用 两 个 10ad 和 一 个 add。 


7.7 结构 引用 


出 现在 大 多 数 程序 设计 语言 中 的 另 一 种 复杂 的 数据 结构 是 结构 或 其 某 种 变形 。 在 C 语 言 中 ， 结 构 汇 
总 各 命名 元 素 ， 它 们 通常 具有 不 同 的 类 型 。 例 如 ， 在 C 语 言 中 ， 可 以 使 用 下 面 的 结构 来 创建 整数 列表 : 


struct node { 
int value; 
struct node *next; 


} 
NilNode = {0, (struct node*) 0}; 
struct node *NIL = &Ni}Node; 


每 一 个 node 包 含 一 个 整数 和 一 个 指向 另 一 个 node 的 指针 。Ni1Node 是 一 个 带 有 值 0 并 将 next 设 为 非法 值 
(0) 的 node。 

在 C 语 言 中 使 用 结构 要 求 使 用 指针 值 (pointer value )。 例 如 ，NIL 的 声明 创建 类 型 为 指向 node 的 指针 
的 值 ， 并 且 初 始 化 这 个 值 使 得 它 指向 Mi 1Node (使 用 取 地 址 操作 符 &)。 指 针 的 这 样 的 使 用 给 编译 器 带 来 
两 个 不 同 的 问题 : Egi (anonymous value) 和 结构 布局 (structure layout). 


7.7.1 装 入 和 存储 匿名 值 
C 语 言 以 两 种 方式 创建 结构 实例 。 它 可 以 声明 结构 实例 ， 在 前 述 的 例子 中 ，NileNode 被 声明 为 一 个 
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node 实 例 。 另 外 ， 代 码 也 可 以 动态 地 分 配 结构 实例 。 对 于 被 声明 为 指向 node 的 指针 变量 fee， 这 一 分 配 
如 下 所 示 : 


fee = (node *) malloc(sizeof (node)); 


对 于 这 一 新 node 的 惟一 存 取 是 通过 指针 fee。 因 此 ， 我 们 可 以 认为 它 是 一 个 匿名 值 ， 因为 它 没有 永久 的 
名 字 。 

因为 匿名 值 的 惟一 名 字 是 指针 , 所 以 编译 器 无 法 轻易 地 确定 两 个 指针 引用 是 否 指向 同一 个 内 存 位 置 。 
考虑 下 面 的 代码 片段 : 


pl = (node *) malloc(sizeof (node)); 
p2 = (node *) malloc(sizeof(node)); 
TF Corwen) 

then p3 = pl; 

else p3 = p2; 
pl->value = ...; 
p3->value = ...; 





= pl->value; 





pte ad 


前 两 行 创建 匿名 node。 第 6 行 对 经 由 pl 能 到 达 的 node 进 行 写 入 ， 而 第 7 行经 由 p3 进 行 写 入 。 因 为 这 两 个 语 
句 经 由 if-then-e1se，p3 既 可 能 引用 在 第 1 行 分 配 的 node， 也 可 能 引用 在 第 2 行 分 配 的 node。 最 后 ， 第 8 
行 引用 p1->value。 

为 了 实现 第 6 行 到 第 8 行 的 赋值 序列 ， 编译 器 应 该 在 寄存 器 中 保存 复 用 的 值 。 遗 憾 的 是 ， 编 译 器 无 法 
轻易 地 确定 第 8 行 是 引用 在 第 6 行 生成 的 值 还 是 引用 在 第 7 行 生成 的 值 。 为 了 知道 在 第 8 行 中 引用 了 哪个 
Node , 编译 器 必须 知道 在 第 3 行 评估 的 条 件 表达 式 的 值 。 尽管 在 某 些 特殊 的 实例 中 这 是 可 能 的 (例如 1 >2)， 
但 在 一 般 情况 下 编译 器 是 无 法 确定 的 。 除非 编译 器 对 这 一 条 件 表达 式 的 值 非常 了 解 ， 它 必须 为 这 三 个 赋 
值 发 行 保守 的 代码 。 它 必须 从 内 存 装 入 第 8 行使 用 的 值 ， 即使 最 近 在 寄存 器 中 已 经 有 这 个 值 。 

对 于 匿名 对 象 引用 的 这 一 不 确定 性 使 得 编译 器 无 法 把 基于 指针 的 引用 所 使 用 的 值 保存 在 寄存 器 中 。 
从 而 使 得 包含 基于 指针 引用 的 语句 不 如 相应 的 非 歧 义 性 局 部 变量 上 的 计算 高 效 。 分 析 指 针 值 并 使 用 分 析 
的 结果 来 消除 歧义 性 引用 ， 即 用 一 种 使 得 编译 器 能 够 保留 某 些 寄存 器 的 值 的 方法 重 写 引用 ， 是 大 量 使 用 
指针 的 程序 的 可 能 优化 的 主要 来 源 。 遗 憾 的 是 ， 消除 歧义 性 指针 引用 所 需 的 分 析 可 能 成 本 过 高 ， 因 为 它 
可 能 要 求 编译 器 检查 整个 程序 。 

大 量 使 用 数组 的 代码 也 存在 类 似 的 效应 。 除非 编译 器 对 数组 下 标 执行 深入 的 分 析 ， 编 译 器 无 法 确定 
两 个 数组 引用 是 否 重合 。 当 编译 器 不 能 区 分 诸如 a[i，j，k] 和 a[i， j，1] 这 样 的 两 个 引用 时 ， 它 必须 保 
守 地 处 理 这 两 个 引用 。 消 除数 组 引用 歧义 性 的 问题 是 具有 挑战 性 的 ， 但 要 比 消除 指针 引用 歧义 性 的 问题 
容易 。 


7.7.2 理解 结构 布局 


当 编 译 器 为 结构 引用 发 行 代码 时 ， 它 需 要 知道 结构 实例 的 起 始 地 址 和 偏 移 量 以 及 每 个 结构 元 素 的 长 
度 。 为 了 维护 这 一 信息 ， 编 译 器 一 般 构建 一 个 独立 的 结构 布局 表 。 这 一 编译 时 表 必 须 包含 每 个 结构 元 素 
的 文本 名 称 、 它 在 这 一 结构 的 偏 移 量 以 及 它 在 源 语言 中 的 数据 类 型 。 对 于 列表 的 例子 ， 编译 器 可 能 构建 
下 面 的 结构 : 
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结构 布局 表 





元 素 表 中 的 各 项 使 用 完整 的 限定 名 。 这 样 可 以 避免 在 若干 不 同 结构 中 复 用 名 字 而 引发 的 冲突 。( 很 少 有 
语言 要 求 程序 在 不 同 的 结构 中 使 用 不 同 的 元 素 名 字 ,) 

利用 这 样 的 信息 ， 编 译 器 可 以 容易 地 为 结构 引用 生成 代码 。 对 于 声明 为 node * 的 指针 pl1，3 引 | 用 pl 一 next 
可 能 翻译 成 如 下 ILOC 序 列 : 


loadl 4 => r // next 的 偏 移 
loadAO rast = r2 // pl->next 的 值 


在 这 里 ， 通 过 从 这 一 结构 表 中 node 项 到 元 素 表 中 node 的 项 的 链 跟踪 这 一 表 ， 编 译 器 找到 next 的 偏 移 量 。 
遍历 这 一 node 的 项 的 链 ， 编 译 器 找到 node .next 的 项 和 它 的 偏 移 量 4。 

在 对 结构 进行 布局 并 把 偏 移 量 赋 给 它 的 元 素 时 ， 编 译 器 必须 遵守 目标 机 器 的 排列 规则 。 这 可 能 迫使 
编译 器 在 结构 中 留 出 未 使 用 空间 。 当 编译 器 对 下 面 左边 声明 的 结构 进行 布局 时 ， 它 遇 到 这 样 的 问题 : 


struct example { 0 4 8 12 16 20 24 28 


int fee; [fee] :| fie [foe] ] fum | 


double fie; 按 声明 排列 的 元 素 
int foe; 


double fum; 0 4 8 12 16 20 
es fie 
按 对 齐 排列 
右上 图 给 出 当 编 译 器 被 限制 为 按 声明 顺序 放置 元 素 时 的 结构 布局 。 因 为 fie 和 fum 必 须 双 字 对 齐 ， 所 
以 编译 器 必须 在 fee 和 foe 之 后 插入 填充 空间 。 如 果 编 译 器 可 以 随意 排列 内 存 中 元 素 ， 那 么 它 可 以 使 用 上 
图 右 下 方 所 示 的 布局 ， 从 而 避免 填充 空间 的 需求 。 这 是 语言 设计 的 问题 : 语言 定义 指定 结构 的 布局 是 否 
要 向 用 户 公开 。 


7.7.3 结构 数组 


很 多 程序 设计 语言 允许 用 户 声 明 结构 数组 。 如 果 允 许 用 户 取 数组 的 结构 值 元 素 的 地 址 ， 那 么 编译 器 


必须 在 内 存 中 把 这 一 数据 布局 为 这 一 结构 布局 的 多 重 拷贝 。 如果 程序 员 不 能 取 数 组 的 结构 值 元 素 的 地 址 ， 
那么 编译 器 可 能 把 这 一 数据 布局 为 由 本 身 是 数组 的 元 素 构成 的 结构 。 依赖 于 周围 代码 对 数据 的 存 取 方 式 ， 
这 两 个 策略 在 带 有 缓冲 内 存 的 系统 上 可 能 性 能 完全 不 同 。 

为 了 对 布局 成 结构 的 多 重 拷贝 的 结构 数组 寻 址 ， 编 译 器 使 用 如 7.5 节 中 所 述 的 数组 地 址 多 项 式 。 这 
一 结构 的 总 长 ， 包 括 所 有 所 需 的 填充 空间 ， 成 为 地 址 多 项 式 中 的 元 素 大 小 w。 这 一 多 项 式 生成 这 一 结构 
实例 的 起 始 地 址 。 为 了 得 到 特定 元 素 的 值 ， 这 个 元 素 的 偏 移 量 被 加 到 这 一 实例 的 起 始 地 址 上 。 


w 
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如 果 编 译 器 把 数据 布局 为 元 素 是 数组 的 结构 ， 那 么 它 必须 使 用 偏 移 量 表 信息 和 数组 维 数 计算 元 素数 
组 的 起 始 位 置 。 使 用 适当 的 数组 地 址 多 项 式 ， 这 一 地 址 可 以 用 作 地 址 计算 的 起 始点 。 


7.7.4 联合 和 运行 时 标签 


联合 及 其 变 体 展示 额外 的 复杂 性 。 为 了 发 行 对 联合 元 素 引用 的 代码 ， 编 译 器 必须 把 引用 解析 成 特定 
的 偏 移 量 。 联 合 可 以 包含 多 重 结构 定义 。 如 果 多 重 结构 定义 使 用 相同 的 名 字 ， 那 么 编译 器 需要 一 种 把 这 
一 名 字 解 析 成 运行 时 对 象 中 预期 位 置 的 方法 。 

这 一 问题 有 一 个 语言 学 上 的 解决 方案 。 程 序 设计 语言 可 以 迫使 程序 员 使 引用 不 具 歧 义 性 。 考 虚 下 面 
的 C 语 言 声明 : 

struct nl { union two { 

int kind; struct { 

int value; int kind; 

} il; int value; 

struct n2 { } inode; 

int kind; struct { 

float value; int kind;° 

} fl; float value; 

union one { } fnode; 

struct nl inode; } u2; 

struct n2 fnode; ul. inode.value = 1; 

} ul; u2.fnode.value = 2.0; 
两 个 联合 one 和 two 都 可 以 保存 一 个 带 有 整数 值 或 浮 点 值 的 node。 为 了 区 分 它们 ， 程 序 员 必须 编写 完整 限 
定名 ， 如 上 例 末 尾 的 两 个 赋值 中 所 示 的 那样 。 

注意 n1 和 mn2 本 身 也 是 结构 声明 。 程 序 员 可 以 分 配 并 处 理 n1 和 n2。 相 反 ，two 的 定义 创建 并 使 用 只 在 
two 的 上 下 文中 有 意义 的 两 个 匿名 结构 。 为 了 减轻 编写 这 些 完整 限定 名 的 负担 ， 这 一 定义 倾向 于 把 区 分 两 
个 变 体 的 责任 交 给 类 型 系统 。 然 而 在 实践 中 ， 很 难保 证 对 联合 中 的 元 素 的 引用 可 以 转换 成 单一 的 类 型 。 

作为 另外 一 个 选择 ， 某 些 系 统 依赖 于 运行 时 区 分 。 在 这 里 ， 联 合 中 的 每 一 变 体 有 一 个 不 同 于 其 他 变 
体 的 域 。 编 译 器 可 以 发 行 检查 那个 域 的 值 的 代码 ， 这 本 质 上 是 基于 区 分 域 的 值 的 选择 语句 ， 从 而 保证 每 
一 个 对 象 得 到 正确 的 处 理 。 语 言 可 能 要 求 程序 员 在 声明 中 包含 这 个 “标签 ” 域 和 它 的 值 ， 另 外， 编译 器 


也 可 能 自动 地 生成 并 插入 标签 。 在 这 样 的 系统 中 ， 编 译 器 有 很 强 的 类 型 检测 的 动机 ， 消 除 类 型 相关 的 代 


码 可 以 在 很 大 程度 上 节省 运行 时 间 和 代码 空间 。 

当然 ， 对 于 变 体 中 相同 的 部 分 ,语言 可 以 允许 对 其 使 用 不 完整 的 限定 名 。 很 多 语言 认识 到 这 一 点 
并 以 某 种 特殊 的 方法 处 理 变 体 的 相同 原始 成 分 。 程 序 可 以 通过 把 这 些 原 始 成 分 限定 到 特定 的 变 体 来 引 
用 它们 。 


7.8 控制 流 结构 


一 个 基本 块 只 是 一 个 直线 型 、 非 判定 代码 的 最 大 长 度 序列 。 对 控制 流 设 有 影响 的 任意 语句 都 可 以 出 
现在 一 个 块 内 。 所 有 控制 流转 移 结束 一 个 块 ， 带 标签 语句 也 同样 ， 因 为 它 是 分 支 的 目标 。 当 编译 器 生成 
代码 时 ， 它 可 以 通过 简单 地 汇集 连续 、 无 标签 和 非 控制 流 操 作 来 构建 基本 块 。( 我 们 假设 带 标签 语句 不 
是 被 无 偿 地 加 上 标签 ， 即 每 个 带 标签 语句 都 是 某 个 分 支 的 目标 。) 基本 块 的 表示 无 需 太 复杂 。 例 如 ， 如 
果 编 译 器 拥有 存放 于 简单 线性 数组 中 的 汇编 式 表示 ， 那 么 块 可 以 由 序 对 <first，las 心 来 描述 ， 这 一 序 对 


保存 块 开 始 和 块 结束 指令 的 索引 。( 如 果 块 索引 是 以 递增 数字 序 存储 的 ， 那 么 一 个 frst 数 组 就 足够 了 。) 


为 了 把 一 组 块 结合 到 一 起 使 它们 形成 一 个 过 程 ， 编 译 器 必须 插入 实现 源 程 序 控制 流 操作 的 代码 。 为 
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了 刻画 块 之 间 的 关系 ， 很 多 编译 器 构建 控制 流 图 (CFG， 参 见 5.3.2 节 和 9.2.1 节 ) 并 使 用 这 一 图 做 分 析 、 
优化 和 代码 生成 。 在 CFG 中 ， 结 点 表示 基本 块 ， 边 表示 块 之 间 的 可 能 控制 转移 。CFG 一 般 是 一 种 派生 表 
示 ， 它 包含 对 每 一 个 块 的 更 详细 表示 的 引用 。 

实现 控制 流 构造 的 代码 居于 基本 块 中 ， 它 在 每 一 个 块 的 尾 端 处 或 尾 端的 附近 。(ILOC 没 有 在 分 支 中 
落空 的 情况 ， 所 以 每 一 个 块 结束 于 一 个 分 支 或 跳 转 。 如 果 IR 模 型 化 等 待 槽 ， 那 么 控制 流 操 作 可 以 不 是 块 
中 的 最 后 操作 。 ) 尽管 很 多 语法 约定 被 用 于 表示 控制 流 ， 但 是 其 基础 概念 却 很 少 。 本 节 列 举 现代 程序 设 
计 语 言 中 建立 的 大 多 数控 制 流 结构 。 


7.8.1 条 件 执行 
大 多 数 程 序 设 计 语言 提供 某 种 版 本 的 if-then-e1se 结 构 。 给 定 源 程序 文本 : 


if expr 
then statement, 
else statement, 
Statements 


编译 器 必须 生成 评估 expr 的 代码 以 及 基于 这 一 expr 的 评估 值 到 statement 或 statemenb 的 分 支 。 实 现 
statement| 和 和 statement, 的 ILOC 代 码 必 须 结束 于 一 个 到 statement; 的 跳 转 。 如 7.4 节 所 述 ， 编 译 器 对 实现 if- 
then-else 有 多 种 选择 。 

7.4 节 中 的 讨论 集中 于 评估 控制 表达 式 。 它 指出 基础 指令 集合 是 对 处 理 控 制 表达 式 的 策略 以 及 在 某 
些 情况 下 处 理 被 控制 语句 的 策略 的 影响 。 

程序 员 可 以 把 任意 大 的 代码 片段 放置 到 then 和 e1se 部 分 。 这 些 代码 片段 的 大 小 对 编译 器 实现 1f- 
then-e1se 结 构 的 策略 有 直接 的 影响 。 对 于 如 图 7-6 所 示 的 平凡 的 then 和 e1se 部 分 ， 编 译 器 主要 考虑 的 是 
使 表达 式 的 评估 与 底 月 硬件 相 匹配 。 当 then 和 el1se 部 分 增长 时 ，then 和 e1se 内 部 的 高 效 实现 的 意义 开 
始 超出 执行 控制 表达 式 的 代价 。 

例如 ， 在 一 台 支 持 谓词 执行 的 机 器 上 ， 在 then 和 e1se 内 部 的 较 大 模块 使 用 谓词 可 能 浪费 执行 周期 。 
因为 处 理 器 必须 把 每 个 谓词 指令 传送 到 一 个 功能 单元 , 所 以 带 有 假 谓 词 的 每 一 个 操作 也 有 一 个 机 会 成 本 ， 
它 被 绑 定 到 一 个 传送 槽 。 对 于 then 和 el1se 下 的 代码 的 较 大 模块 ， 非 执行 指令 的 成 本 可 能 超过 使 用 条 件 分 
支 的 负荷 。 

图 7-10 说 明了 这 一 权衡 。 图 7-10 假 设 then 和 el1se 都 包含 十 个 彼此 独立 的 ILOC 操 作 ， 而 且 假 设 县 标 
机 器 在 每 个 周期 可 以 发 行 两 个 操作 。 

左 侧 给 出 使 用 谓词 可 能 生成 的 代码 ; 它 假设 控制 表达 式 的 值 在 ri 内 。 这 一 代码 在 每 个 周期 发 行 两 个 
指令 。 在 每 个 周期 执行 其 中 的 一 个 。then 部 分 的 所 有 操作 被 发 行 到 Unit 1， 而 else 部 分 的 所 有 操作 被 发 
行 到 Unit 2。 这 一 代码 避 开 所 有 分 支 。 如 果 每 一 个 操作 需要 一 个 周期 ， 那 么 它 需要 十 个 周期 来 执行 被 控 
制 语 句 ， 这 与 执行 的 分 支 无 关 。 

右 侧 给 出 使 用 分 支 而 生成 的 代码 ; 它 假 设 对 于 then 部 分 控制 流 到 Li ， 而 对 于 e1se 部 分 控制 流 到 L:。 
因为 指令 是 独立 的 ， 所 以 这 一 代码 在 每 个 周期 发 行 两 个 指令 。 沿 着 then 路 径 需要 五 个 周期 来 执行 对 这 一 
路 径 的 操作 ， 加 上 最 终 的 跳 转 的 代价 。e1se 路 径 的 代价 与 此 相同 。 

谓词 版 本 避 开 了 非 谓 词 代码 中 所 需要 的 初始 分 支 (图 中 到 L; 或 者 到 L;: 的 分 支 )， 也 避 开 了 终端 跳 转 
(到 Ls)。 分 支 版 本 承受 一 个 分 支 和 一 个 跳 转 的 额外 负荷 ， 但 是 可 能 执行 的 更 快 。 每 一 个 路 径 包 含 一 个 条 
件 分 支 、 五 个 操作 的 周期 和 终端 跳 转 。( 有 些 操 作 可 能 用 于 填充 跳 转 上 的 等 待 槽 。.) 谓词 版 本 与 分 支 版 本 
的 差异 在 于 有 效 发 行 率 ， 分 支 版 本 发 行 的 指令 数目 大 约 为 谓词 版 本 发 行 的 指令 数目 的 一 半 。 当 then 和 
el1se 中 的 代码 片段 增 大 了 时， 这 一 差异 就 明显 增 大 。 


U 





206 #7 


使 用 谓词 使 用 分 支 
Uniti Unit2 Unitl Unit2 


比较 一 六 比较 与 分 支 
(rı) op:  (=r1) opn Li: op 
(rı) ope = (=r) opie 
(rı) ops (~r1) opl3 
(rı) opa  (=r1) Opu 
(rı) ops (~ri) opis oplo 
(rı) ops (nri) Opis jumpI 一 L; 
(rı) opp  (=rı) opi : OPi 0plz 
(rı) ope (mri) Opis op13 Opu 
(ri) ops (>r1) opis Opis Opie 
(ri) oplo (~ri) opzo OPi7 = OPig 
OPig = P20 
jumpI 一 Ly 
L3: nop 





图 7-10 谓词 与 分 支 的 比较 


用 户 所 做 的 分 支 预测 | 
对 于 编译 器 ， 有 一 个 关于 分 支 预 测 的 传说 。FORTRAN 拥 有 一 个 算术 if 语句 ， 该 语句 基于 控制 | 
| 表达 式 被 评估 到 一 个 负数 、0 还 是 一 个 正 数 来 采取 三 个 分 支 中 的 一 个 。 一 个 早期 编译 器 允许 用 户 为 

每 个 标签 提供 一 个 权 ， 以 此 反映 采取 该 分 支 的 相对 概率 。 这 一 编译 器 使 用 这 些 权 来 对 分 支 进行 排序 ， 


使 得 分 支 的 预期 等 待 达到 最 小 。 | 

故事 发 生 在 这 一 编译 器 推出 的 一 年 之 后 :一 位 维护 人 员 发 现 编译 器 是 按 相反 顺序 使 用 分 支 加 权 | 
| 的 ， 它 最 大 化 预期 等 待 。 在 此 之 前 没有 任何 人 抱怨 过 。 这 个 故事 告诉 我 们 ， 程 序 员 关 于 他 们 所 编写 | 
| 代码 的 行为 的 那些 判断 是 没有 意义 的 。( 当然 ， 没 有 报告 显示 有 人 改进 了 那个 编译 器 ， 使 其 按 正确 | 
的 顺序 使 用 分 支 加 权 。) | 





在 使 用 分 支 还 是 谓词 来 实现 if-then-e1se 的 选择 上 需要 格外 小 心 。 应 该 考虑 下 面 儿 个 问题 : 

1) 每 个 部 分 的 期 望 执 行 频率 。 如 果 条 件 的 一 边 的 期 望 执行 比 另 一 边 多 很 多 ， 那 么 加 速 那 一 路 径 的 
执行 的 技术 可 能 产生 更 快 的 代码 。 这 一 倾向 性 可 以 取 谓 词 判 断 分 支 的 形式 、 推 测 性 地 执行 某 些 指令 的 形 
式 或 重 排 逻 辑 的 形式 。 

2) 代码 的 不 平均 量 。 如 果 结 构 的 一 条 路 径 包 含 的 指令 数目 比 另 一 条 路 径 包含 的 指令 数目 多 很 多 ， 
那么 这 可 能 倾向 于 谓词 或 谓词 与 分 支 的 结合 。 

3) 结构 内 的 控制 流 。 如 果 结 构 的 某 条 路 径 包 含 非 平凡 的 控制 流 ， 例 如 另 一 个 if-then-e1se、 一 个 
循环 、 一 个 选择 语句 或 一 个 过 程 调用 ， 那 么 谓词 可 能 不 是 最 有 效 的 选择 。 特 别 是 嵌 套 的 1f 结 构 创建 更 复 
杂 的 谓词 表达 式 ， 同 时 降低 被 发 行 指令 的 实际 执行 率 。 

为 了 做 出 更 好 的 决策 ， 编 译 器 必须 考 虚 所 有 这 些 因 素 ， 同 时 还 要 考虑 周转 的 上 下 文 。 这 些 因素 在 编 
译 的 早期 可 能 难以 评估 ; 例如 ， 优 化 可 能 使 它们 发 生 重大 的 改变 。 
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7.8.2 循环 和 和 迭代 


大 多 数 程序 设计 语言 包含 执行 选 代 的 循环 结构 。 第 一 个 FORTRAN 编 译 器 引入 了 do 循环 来 执行 迭代 。 
今天 ,循环 有 多 种 形式 。 它 们 的 主要 部 分 有 相似 的 结构 。 

以 C 语 言 的 for 循 环 为 例 。 图 7-11 展 示 编 译 器 如 何 对 代码 进行 布局 。for 循 环 有 三 个 控制 表达 式 : 提 
供 初始 化 的 e; 评估 为 一 个 布尔 值 并 控制 循环 执行 的 e;; 在 每 一 次 迭代 的 尾 端 执行 并 主要 用 于 更 新 e 中 
使 用 的 值 的 e:。 我 们 将 使 用 图 7-11 作 为 解释 若 于 种 循环 的 实现 的 基本 方案 。 


测试 e> r 


for (ei; e2; e) { cbr r; 33,5 


循环 体 
循环 体 


} 
for 循 环 举例 评估 < 


测试 ez 之 站 
cbr r; 一 3,5 


循环 后 的 代码 





图 7-11 C 语 言 中 for 循 环 的 代码 布局 


如 果 循 环 体 是 由 单一 基本 模块 组 成 的 ， 即 它 不 包含 其 他 控制 流 ， 那 么 得 自 于 这 一 方案 的 循环 有 一 个 
初始 分 支 ， 加 上 每 次 迭代 的 一 个 分 支 。 编 译 器 也 许 用 下 面 两 种 方式 之 一 隐藏 这 一 分 支 的 等 待 。 如 果 体 系 
结构 允许 编译 器 判断 是 否 要 采用 这 一 分 支 ， 那 么 编译 器 应 该 在 步骤 四 判断 这 一 分 支 被 采用 〈 并 开始 下 一 
次 迭代 )。 如 果 体 系 结构 允许 编译 器 把 指令 移 进 这 一 分 支 的 等 待 槽 ， 那 么 编译 器 应 该 设法 用 循环 体 的 指 
令 填充 等 待 槽 。 

1. for 循 环 

为 了 把 for 循 环 映射 到 代码 中 ， 编 译 器 遵循 图 7-11 的 方案 。 下 面 的 例子 通过 展示 产生 于 特定 循环 的 
ILOC 代 码 做 出 五 个 具体 步 景 。 步 又 1 和 步 又 2 产生 单一 基本 块 ， 代 码 如 下 所 示 : 


loadl 1 > Yi // 步骤 1 
loadl 100 >r // 步骤 2 
cmp-GT r,r => r2 

for (i=l; i<=100; i++) { cbr rz > LU 


w 
un 
© 


循环 体 
} Li: 循环 体 // BR3 
后 继 语 句 addI mil > ñ // 步骤 4 


cmp-LE miyrl => r3 
cbr rs 一 Lisl 


Lo: 后 继 语句 // BRS 


EXAM, PRU M alee Rl BA-T+AER PRS REA. MRK (FR) 
或 者 由 单一 基本 模块 组 成 ， 或 者 结束 于 单一 基本 模块 ， 那 么 在 步骤 4 中 的 更 新 和 测试 可 以 使 用 这 一 模块 
而 得 到 优化 。 从 而 允许 编译 器 改进 这 一 代码 ， 例 如 ， 编 译 器 使 用 步 又 3 的 尾 端的 操作 填充 步 允 4 的 分 支 中 





208 £7 


RO FTE 

Sai 3 tT AE AMIE RA SRS OL, A ROR. ARER, BORE Te RIG 
PAD R2. 循环 的 这 一 形式 比 两 测试 形式 少 一 个 操作 。(cmp-6T 消 失 , 而 且 cbr 变 成 一 个 jump。) 然而 ， 
它 甚 至 为 最 简单 的 循环 创建 一 个 两 模块 的 循环 ， 而 且 使 通过 循环 的 路 径 至 少 加 长 一 个 操作 。 当 代码 大 小 
是 一 个 重要 的 考虑 因素 时 ， 那 么 统一 使 用 这 一 更 简洁 的 循环 形式 是 值得 的 。 只 要 循环 结束 跳 转 是 一 个 立 
即 跳 转 ， 硬 件 可 以 最 小 化 它 可 能 引起 的 任意 中 断 。 

图 7-11 的 这 一 规范 的 循环 形态 也 为 后 期 的 优化 设置 平台 。 例 如 ， 如 果 e 和 e: 只 包含 已 知 常量 ， 如 在 
这 一 例子 中 那样 ， 那 么 编译 器 可 以 把 步 只 1 的 值 先入 步骤 2 的 测试 ， 同 时 或 者 消除 比较 和 分 支 (如果 控 制 
进入 循环 ), 或 者 消除 循环 体 (如 果 控 制 从 不 进入 循环 体 )。 在 单一 测试 循环 中 ， 编 译 器 无 法 做 到 这 一 点 。 
这 时 ， 编 译 器 发 现 到 达 这 一 测试 的 两 条 路 径 ， 一 条 路 径 从 步 喉 1 开始 ， 另 一 个 路 径 从 步骤 4 开始 。 用 于 测 
试 的 值 沿 着 步骤 4 开始 的 边 有 可 变 值 ， 所 以 测试 的 结果 是 不 可 预测 的 。 

2. FORTRAN 的 do 循环 

在 FORTRAN 中 ， 和 迭代 循环 是 do 循环 。 它 类 似 于 C 语 言 的 for 循 环 ， 但 是 有 更 严格 的 形式 。 

YoadI 1 >r //jel 


loadI 1 >r // $m 
loadI 100 >r // $5 2 


于 = 1 cmp.GT rir = re 
do math i, 100 br ry 一 Lz ,Li 
j=j+2 Li: 循环 体 . // BR 3 
10 continue addl rj,2 ary //jcj+2 
i. 
后 继 语句 add! r,l > ñ // ER 4 


cmp-LE riri > rs 
cbr r; 一 Li,tz 


Lo: 后 继 语句 // BRS 


注释 把 部 分 ILOC 代 码 映 射 回 到 图 7-11 的 方案 中 。 
如 很 多 语言 的 定义 一 样 ，FORTRAN 的 定义 有 一 些 有 趣 的 特点 。 其 中 的 一 个 与 do 循环 以 及 它们 的 索 
引 变量 相关 。 循 环 的 选 代数 量 在 执行 进入 循环 之 前 是 固定 的 。 如 果 程 序 改变 索引 变量 的 值 ， 那 么 这 一 改 
变 不 影响 执行 的 选 代数 量 。 例 如 ， 下 面 的 循环 应 该 执行 100 次 选 代 ， 即 使 这 一 循环 递增 i。 


loadl 1 > ñ // FR 1 
loadI 1 之 mi  // 影子 
YoadI 100 >r // #2 
cmp-GT rir: > r3 


do 10 i = 1, 100 cbr 3 一 L2,L; 
循环 体 
i=i+2 Lit 循环 体 // BR 3 
10 continue addI ri,2 > ñ //ieir+2 
后 继 语 句 addI ri,l > r // FR 4 


addi r,l > r // B+ 
cmp-LE ry,t2 = rs 
cbr r4 > Lisl? 


Le: 后 继 语句 // 步 5 
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为 了 保证 正确 的 行为 ， 编 译 器 也 许 需 要 生成 一 个 称 为 影子 索引 变量 (shadow index variable) 的 隐 式 归 
纳 变量 来 控制 迭代 。 在 本 例 中 ， 这 一 影子 索引 变量 是 rz。 

除非 编译 器 可 以 确定 循环 体 对 这 一 归纳 变量 不 做 修改 ， 否 则 编译 器 必须 生成 一 个 影子 变量 。 如 果 循 
环 包含 对 另 一 个 过 程 的 调用 且 把 归纳 变量 作为 引用 调用 参数 传递 ， 那 么 编译 器 必须 假设 被 调用 过 程 修改 
这 一 归纳 变量 ， 除 非 编译 器 能 够 证 明 它 不 被 修改 。 

过 程 间 分 析 ， 即 整个 程序 的 分 析 ， 处 理 上 述 问 题 。 程 序 员 把 循环 索引 变量 如 i 作为 一 个 参数 传递 ， 
这 使 得 程序 能 够 在 它 生成 的 输出 中 包含 这 一 索引 值 。 过 程 间 分 析 可 以 轻松 地 识别 何 时 传递 循环 索引 变量 
不 改变 它 的 值 。 这 使 得 编译 器 能 够 消除 影子 变量 。 

3. Whi1e 循 环 | 

while 循 环 也 可 以 使 用 图 7-11 的 循环 方案 来 实现 。 与 C 语 言 的 for 循 环 或 FORTRAN 的 do 循环 不 同 ， 
while 循 环 没 有 初始 化 。 因 此 ， 这 一 循环 的 代码 更 简洁 : 

cmp_LT rwory > r // 步骤 2 

cbr r > Lisle 
L: 循环 体 // BR 3 


cmp-LT ry,ry > re // BOR 4 
cbr mr > Lyle 


le: 后 继 语 名 // BRS 


while (x < y) { 
循环 体 


} 
后 继 语 句 


复制 步骤 4 的 测试 给 出 使 用 单一 基本 块 创建 循环 的 可 能 性 。for 循 环 中 得 到 的 成 果 同 样 也 可 运用 于 while 
循环 。 

4. Until AR 

只 要 控制 表达 式 为 假 ，unti1 循 环 就 一 直 和 迭代 下 去 。 它 在 每 一 次 迭代 后 检查 控制 表达 式 。 因 此 ， 它 
总 是 进入 循环 并 至 少 执行 一 次 迭代 。 这 产生 一 个 特殊 的 简单 循环 结构 ， 因 为 它 避 开 了 方案 中 的 步骤 1 和 
步骤 2。 


{ Li: 循环 体 // BR 3 
循环 体 cmp-LT mrxsry > m2 // 步骤 4 

} niet (x < y) cor rm > Layla 

后 继 语 名 lo: 后 继 语句 // BRS 


C 语 言 设 有 unti1 循 环 。 它 的 do 结构 类 似 于 unti1 循 环 ， 只 是 条 件 的 意义 被 逆 置 。 只 要 条 件 表达 式 评 估 为 
真 ，do 循 环 就 一 直 返 代 下 去 ， 而 只 要 条 件 评估 为 假 unti1 循 环 就 一 直选 代 下 去 。 

5. 把 迭代 表示 成 为 尾 递 归 

在 类 Lisp 语 言 中 ，( 程 序 员 ) 常常 使 用 递归 风格 的 形式 来 实现 迭代 。 如 果 一 个 函数 执行 的 最 后 一 个 
动作 是 一 次 调用 ， 那 么 这 一 调用 称 为 尾 调 用 (tail call)。 如 果 这 一 尾 调用 是 一 个 自 递归 ， 那 么 这 个 调用 
> AK Ja (tail recursion)。 例 如 ， 为 了 在 Scheme 中 寻找 一 个 列表 的 最 后 一 个 元 素 ， 那 么 程序 员 可 以 编 
写 下 面 简单 的 函数 : 

(define (last alon) 

(cond 
((empty? alon) empty) 


((empty? (cdr alon)) (car alon)) 
(else (last (cdr alon))))) 


Y 
nN 
N 
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尾 递归 调用 可 以 优化 成 一 个 返回 过 程 头 部 的 跳 转 ， 加 上 创建 参数 绑 定 效应 的 某 些 赋值 。 因 此 ， 这 一 代码 
可 以 避免 过 程 调用 中 的 大 部 分 额外 开销 。 它 无 需 创建 新 的 AR、 评 估 参 数 、 存 储 和 恢复 寄存 器 ， 以 及 调 
整 显 示 或 存 取 链 接 。 大 部 分 调用 前 序列 消失 ; 所 有 返回 后 序列 消失 。 另 外 ， 它 避免 调用 的 标准 实现 中 可 
能 执行 的 所 有 返回 〈 和 结束 语序 列 )。 结 果 代 码 从 效率 上 可 以 与 for 循 环 相 匹敌 。 


7.8.3 选择 语句 


很 多 程序 设计 语言 包含 选择 (case) 语句 的 某 种 变形 。FORTRAN 有 自己 的 计算 转向 (goto) 语句 。 
Algol-W 引 入 了 选择 语句 的 现代 形式 。BCPL 和 C 语 言 有 Switch 结构 。PLA 有 了 映射 到 一 组 俱 套 的 1f-then- 
e1se 语 名 的 一 般 结 构 。 正 如 本 章 所 介绍 的 那样 ， 高 效 地 实现 选择 语句 很 复杂 。 

考虑 C 语 言 的 Switch 语句 。 其 实现 策略 应 该 是 (1) 评估 控制 表达 式 ; (2) 分 支 到 所 选 的 选择 ; 以 
及 (3) 执行 这 一 选择 的 代码 。 步 又 1 和 步骤 3 很 容易 理解 ; 它们 都 遵循 本 章 其 他 地 方 的 讨论 。 这 些 选 择 
通常 结束 于 把 控制 转移 到 Switch 语句 后 面 的 语句 的 break 语 句 。 

实现 选择 语句 的 复杂 部 分 是 发 行 定位 指定 选择 的 有 效 代码 。 

1. 线性 搜索 

定位 适当 选择 的 最 简单 方法 是 把 选择 语句 作为 一 组 储 套 的 if-then-~e1se 语 句 的 描述 处 理 。 例 如 ， 在 
AP RIM switche TL Bit RA MRI. 


switch (bxc+d) tl + bxctd 
if (ty = 0) 
case 0: blocko; then blocky 
break; else if (tl = 1) 
case 1: block; then block, 
break; . else if (tl = 2) 


soe then block, 
case 9: blocks; 


break; else if (tl = 9) 
default: blockjo; then block, 
break; else blocky» 
} 


这 一 翻译 保持 Switch 语句 的 意义 ， 但 是 达到 各 选择 的 代价 取决 于 各 选项 的 编写 顺序 。 这 一 代码 本 质 
上 使 用 线性 搜索 来 发 现 希 望 的 选择 。 当 选择 的 数量 较 小 时 ， 这 一 策略 可 能 很 有 效 。 

2. 二 分 搜索 值 标签 

当选 择 的 数量 增加 了 时， 线性 搜索 的 效率 就 成 了 
问题 。 高 效 搜索 的 经 典 答案 可 以 运用 于 这 一 情况 。 
如 果 编 译 器 能 够 在 选择 标签 上 赋予 一 个 顺序 ， 那 么 
它 可 以 使 用 二 分 搜索 来 得 到 一 个 对 数 时 间 复 杂 度 搜 
索 ， 而 不 是 线性 时 间 复 杂 度 搜索 。 

想法 很 简单 。 编 译 器 构建 一 个 选择 标签 的 紧凑 
的 有 序 表 ， 以 及 它们 相应 的 分 支 标签 。 它 使 用 二 分 
搜索 来 发 现 一 个 匹配 的 选择 标签 ， 或 发 现 不 存在 合 
适 的 选择 。 最 后 ， 它 或 者 分 支 到 相应 的 标签 ， 或 者 
分 支 到 default 选 择 。 

对 于 前 面 所 述 的 Switch 语句 ， 可 以 使 用 右边 的 

跳 转 表 和 搜索 例 程 : 


tl 二 bxc+d 
down <-0 
up e 10 
while (down + 1 < up) 
{ 
middle <— (up + down + 1) + 2 
if (Value[middle] tl) 
then down e- middle 


else up & middle 


} 

if (Value[down]= t,) 
then jump to Label [down] 
else jump to LBgepauit 
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在 这 一 方案 中 ， 每 个 模块 的 代码 片段 是 相互 独立 的 。 块 ;开始 于 一 个 标签 LB,， 结 束 于 跳 转 到 选择 语句 后 
面 语 名 的 跳 转 。defaul 选 择 在 块 LBsefawmt 中 。 

如 果 要 搜索 的 选择 标签 存在 的 话 ， 二 分 搜索 在 log。(n) 个 迭代 中 发 现 该 选择 标签 ， 其 中 n 是 选择 的 
数量 。 如 果 这 一 标签 不 存在 ， 二 分 搜索 发 现 这 一 事实 并 跳 转 到 defau1t 选 择 的 块 。 

因为 编译 器 插入 搜索 代码 ， 所 以 它 需要 小 心地 选择 操作 。middie 的 计算 需要 两 个 加 法 和 一 个 移 位 。 
if-then-e1se 将 花费 更 长 时 间 。 装 入 的 地 址 计算 很 简单 : 一 个 移 位 和 一 个 地 址 + 偏 移 量 的 装 入 。 使 用 条 
件 移动 或 谓词 执行 (参见 7.4.2 节 )， 编 译 器 可 以 用 两 个 操作 更 新 up 和 down。 没 有 这 两 个 操作 ， 更 新 取 一 
个 分 支 、 一 个 拷贝 和 一 个 跳 转 。 


3. 地 址 的 直接 计算 

如 果 选 择 标 签 形成 一 个 稠密 集合 ， 那 么 编译 器 可 以 比 二 分 搜索 做 的 更 好 。 在 上 述 例子 中 ，switch 语 
句 对 每 个 从 零 到 九 的 整数 各 有 标签 。 在 这 样 的 情况 下 ， 编 译 器 可 以 构建 一 个 包含 模块 标签 LB 的 向 量 ， 
并 通过 执行 一 个 简单 的 地 址 计算 找到 适当 的 标签 。 

对 于 这 个 例子 ， 可 以 如 前 所 示 计 算 ti 来 发 现 标 签 ， 并 把 ti 当 作 进入 这 一 表格 的 索引 。 在 这 样 的 情况 
下 ， 实 现 选 择 语句 的 代码 可 能 有 如 下 形式 : 

tebxc+d 

if (0 > ti or tı > 9) 

then jump to LBdefauit 
else 
te «+ memory(@Table + tl x 4) 
jump to tz 
这 里 假设 标签 的 表示 是 4 个 字 节 大 小 。 

对 于 标签 的 稠密 集合 ， 这 一 方案 生成 高 效 代码 。 代 价 很 小 且 是 常数 。 如 果 在 标签 集合 中 有 几 个 洞 ， 
那么 编译 器 使 用 default 选 择 的 标签 填充 这 些 槽 。 如果 没 有 defau1t 选 择 , 那么 适当 的 行动 要 依赖 于 语言 。 
例如 ， 在 C 语 言 中 ， 代 码 要 分 支 到 switch 之 后 的 第 一 个 语句 ， 所 以 编译 器 必须 把 该 语句 的 标签 放置 到 表 
中 的 每 一 个 洞 中 。 

4. 各 方法 之 间 的 选择 

对 每 个 选择 语句 ， 编 译 器 必须 选择 适当 的 实现 方案 。 这 一 决策 依赖 于 选择 的 数量 和 选择 标签 集 的 性 
质 。 对 于 少量 的 选择 ， 嵌 套 的 if-then-e1se 方 案 就 可 以 工作 得 很 好 。 对 于 选择 数量 较 大 且 选 择 值 不 形成 
稠密 集合 时 ， 那 么 二 分 搜索 是 合理 的 选择 。( 然 而 ， 使 用 调试 器 对 汇编 码 进行 按 步 调试 的 程序 员 可 能 惊 
讶 地 发 现 whi1e 循 环 被 嵌入 到 选择 语句 中 ! ) 当选 择 标签 形成 一 个 稠密 集合 时 ， 使 用 跳 转 表 的 直接 计算 
可 能 是 最 好 的 选择 。 

对 于 选择 数量 足够 多 的 情况 ， 编 译 器 也 许 采 用 混合 的 策略 ， 把 两 个 或 更 多 的 方案 结合 到 一 起 。 对 前 
面 所 述 的 跳 转 表 的 寻 址 伪 码 实际 上 就 是 实现 了 一 个 混合 策略 。 这 一 代码 使 用 简单 的 条 件 检查 范围 在 0 到 9 
外 面 的 值 ， 并 且 或 者 跳 转 到 LBoerot， 或 者 使 用 跳 转 表 跳 转 到 适当 的 标签 。 这 使 LBaerant 选 择 成 为 上 述 范 
围 外 的 所 有 值 对 应 的 选择 ， 并 对 于 范围 内 的 选择 的 稠密 集合 使 用 跳 转 表 。 

如 果 编 译 器 设计 者 加 入 跳 转 表 实 现 ， 那 么 应 该 尽 可 能 使 跳 转 的 可 能 目标 对 程序 的 巨 形式 可 见 。 在 
ILOC 中 ， 编 译 器 可 以 生成 tb1 伪 操作 的 适当 集合 。 缺 乏 这 样 的 线索 将 迫使 后 来 的 分 析 遍 把 伪 边 加 到 它们 
所 建立 的 控制 流 图 中 。 这 些 CFG 中 的 错误 将 导致 失去 分 析 产 生 的 信息 的 精确 性 。 


“ 7.8.4 中 断 语句 
若干 语言 实现 break 语 名 或 exit 语 句 的 变形 。break 语 句 是 退出 控制 流 结构 的 一 种 结构 化 方式 。 在 一 
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GRP, breaks tE EAE. FRERE, break—MiR HRAM. 
一 些 语言 ， 例 如 Ada 和 Java 都 允许 在 break 语 句 上 有 可 选 的 标签 。 这 将 引发 break 语 句 从 由 这 个 标签 所 描 
述 的 最 近 结 构 中 退出 。 在 嵌 套 的 循环 中 ， 标 签 化 的 break 人 允许 程序 一 次 退出 若干 循环 。C 语 言 还 把 break 
用 于 switch 语 句 来 把 控制 转移 到 switch 语 名 后 面 的 语句 。 

这 些 动作 有 简单 的 实现 。 每 一 个 循环 和 选择 语句 应 该 结束 于 循环 后 面 语句 的 标签 。 可 以 把 break 实 
现 为 到 这 一 标签 的 立即 跳 转 。 某 些 语 言 包 含 skip 或 continue 语 句 来 跳 转 到 循环 的 下 一 次 和 迭代。 同样 可 以 
把 它们 实现 为 到 重新 评估 控制 表达 式 并 测试 其 值 的 代码 的 立即 跳 转 。 另 外 ， 编 译 器 也 可 以 在 skip 出 现 的 
地 点 简单 地 插入 评估 、 测 试 和 分 支 的 拷贝 。 


7.9 过 程 调用 


过 程 调用 的 绝 大 部 分 的 实现 是 直截了当 的 。 如 图 7-12 所 示 ， 过 程 调 用 由 调用 者 中 的 调用 前 序列 和 返 
回 后 序列 ， 以 及 被 调用 者 中 的 序言 序列 和 结语 序列 组 成 。 一 个 过 程 可 以 有 若干 调用 点 ， 每 个 调用 点 都 有 
自己 的 调用 前 序列 和 返回 后 序列 。 在 大 多 数 环境 下 ， 这 一 过 程 还 包含 一 个 序言 序列 和 一 个 结语 序列 。 9 
其 中 所 涉及 的 大 部 分 内 容 已 在 6.6 节 中 描述 。 本 节 集 中 精力 讨论 影响 编译 器 生成 高 效 、 简 洁 和 相 容 的 过 
程 调用 代码 的 能 力 的 问题 。 

作为 一 般 规则 ， 把 操作 从 调用 前 序列 和 返回 后 序列 移 到 序言 序列 和 结语 序列 可 以 减少 最 终 代码 的 整 
体 大 小 。 如 果 如 图 7-12 所 示 的 从 p 到 4 的 调用 是 在 整个 程序 中 对 4 的 
惟一 调用 ， 那 么 把 操作 从 p 中 的 调用 前 序列 移 到 g 中 的 序言 序列 (以 
及 把 操作 从 p 中 的 返回 后 序列 移 到 gq 中 的 结语 序列 ) 对 代码 的 大 小 没 
有 影响 。 然 而 ， 如 果 存 在 对 gq 的 其 他 调用 ,而且 编译 器 (在 每 个 调 
用 点 ) 把 一 个 操作 从 调用 者 移 到 被 调用 者 ， 那 么 通过 使 用 单一 操作 
替换 该 操作 的 多 重 拷贝 ， 编 译 器 可 以 减 小 整个 代码 的 大 小 。 当 对 单 
一 过 程 的 调用 数量 上 升 时 ， 这 种 代码 减 小 的 程度 就 会 增加 。 我 们 假 
设 大 多 数 过 程 是 从 若干 个 位 置 调用 的 ; 否则 ， 程 序 员 和 编译 器 都 应 
考虑 在 过 程 的 惟一 调用 点 处 内 人 嵌 地 包含 这 个 过 程 。 





”7.9.1 评估 实 参 -图 7-12 标准 一 


在 构建 调用 前 序列 中 ， 编 译 器 必须 发 行 评估 实 参 或 调用 变量 的 代码 。 编 译 器 把 参数 作为 表达 式 处 理 。 
对 于 值 调用 参数 ， 调 用 前 序列 评估 实 参 ， 并 把 评估 结果 存储 为 这 一 参数 指定 的 位 置 上 ， 它 或 者 在 一 个 寄 
存 器 里 ， 或 者 在 被 调用 者 的 AR 中 。 对 于 引用 调用 参数 ， 调 用 前 序列 计算 每 个 实 参 的 地 址 ， 并 把 它 存储 
在 为 这 一 参数 指定 的 位 置 上 。 如 果 这 一 参数 驻 留 在 调用 者 的 寄存 器 中 ， 或 者 这 一 参数 是 一 个 表达 式 ， 那 
么 编译 器 可 能 需要 为 这 一 参数 的 值 创建 一 个 位 置 ， 使 得 它 拥有 传递 到 被 调用 者 的 地 址 。 

如 果 源 程序 指定 实 参 的 评估 顺序 ， 那 么 当然 编译 器 必须 遵守 这 一 顺序 。 否 则 ， 编 译 器 将 使 用 一 个 相 
容 的 顺序 : 或 者 从 左 到 右 ， 或 者 从 右 到 左 。 评 估 顺 序 对 可 能 产生 副作用 的 参数 非常 重要 。 例 如 ， 使 用 两 
个 例 程 push 和 pop 来 处 理 栈 的 程序 在 从 左 到 右 和 从 右 到 左 的 评估 顺序 下 为 序列 push(pop()-pop()) 产 生 
不 同 结果 。 

过 程 可 能 有 若干 隐 式 参数 。 这 些 参数 包括 过 程 的 ARP、 调 用 者 的 ARP、 返 回 地 址 以 及 在 建立 可 寻 址 
性 中 所 需要 的 任何 信息 。 在 面向 对 象 语言 中 ， 接 受 器 的 地 址 是 一 个 隐 式 参数 。 这 些 隐 式 参 数 的 一 部 分 被 


但 ”如 果 语 言 允 许 过 程 有 多 个 出 口 点 ， 如 FORTRAN 和 PL/I 一 样 ， 那 么 过 程 可 能 包含 多 个 序言 序列 。 
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传送 到 寄存 器 里 ; ARP 和 返回 地 址 一 般 驻 留 在 寄存 器 中 。 很 多 体系 结构 有 像 jsr 1abe1i 一 ri 这 样 的 操作 ， 
这 一 操作 把 控制 转移 到 1abe1:， 并 把 下 一 个 操作 (jsr 后 面 的 操作 ) 的 地 址 放置 到 ri 中 。 其 他 陷 式 参 数 ， 
诸如 调用 者 的 ARP， 一 般 驻 留 在 内 存 中 。 


7.9.2 过 程 值 参数 


当 一 个 调用 点 把 过 程 当 作 参 数 传递 时 ， 那 个 值 需要 特殊 的 处 理 。 如 果 p 调 用 9， 作 为 一 个 参数 传递 过 
程 r，p 向 q 传 递 的 信息 必须 比 r 的 开始 地 址 更 多 。 特 别 是 如 果 被 编译 代码 使 用 存 取 链接 来 寻找 非 局 部 变量 ， 
那么 被 调用 者 需要 7 的 词法 级 别 ， 使 得 对 r 的 系列 调用 可 以 找到 r 的 级 别 的 正确 存 取 链 接 。 编 译 器 可 以 构造 
一 个 < 地 址 ， 级 别 > 对 ， 并 把 它 〈 或 它 的 地 址 ) 传递 到 过 程 值 参数 的 位 置 上 。 当 编译 器 为 过 程 值 参数 构建 
调用 前 序列 时 ， 它 必须 插入 额外 的 代码 来 得 到 过 程 的 词法 级 别 ， 并 相应 地 调整 在 取 链 接 。 


7.9.3 保存 和 恢复 寄存 器 


在 所 有 的 调用 约定 下 ， 与 过 程 调 用 相关 的 一 个 或 两 个 过 程 必 须 保存 寄存 器 的 值 。 通 常 ， 链 接 约定 使 
用 调用 者 保存 寄存 器 和 被 调用 者 保存 寄存 器 相 结 合 的 形式 。 随 着 内 存 操作 的 代价 的 增加 和 寄存 器 数量 的 
上 升 ， 在 调用 点 的 寄存 器 保存 和 恢复 的 代价 也 上 升 ， 对 于 这 一 点 值得 特别 留意 。 

在 保存 和 恢复 寄存 器 的 策略 选择 上 ， 编 译 器 设计 者 必须 既 考 虑 效率 又 考虑 代码 的 大 小 。 目 标 机 器 的 
某 些 特性 影响 这 一 选择 。 将 寄存 器 组 的 一 部 分 取出 的 特征 能 够 减 小 代码 的 大 小 。 这 样 的 范例 包括 
SPARC 机 器 上 的 寄存 器 窗口 ，PowerPC 处 理 器 上 的 多 寄存 器 装 入 和 存储 操作 以 及 VAX 上 的 高 级 调用 操 
作 。 它 们 都 向 编译 器 提供 保存 和 恢复 寄存 器 组 的 一 部 分 的 简洁 方法 。 然 而 在 利用 这 些 特征 时 ， 编 译 器 设 
计 者 也 必须 要 考虑 速度 的 问题 。 例 如 ， 在 某 些 PowerPC 模 型 上 ， 一 系列 存储 操作 比 等 价 的 多 元 存储 操作 
要 快 。 


较 大 的 寄存 器 组 在 增加 代码 存储 和 恢复 的 寄存 器 的 数量 的 同时 ， 一 般 也 允许 编译 器 设计 者 使 用 这 些 


额外 的 寄存 器 改进 结果 代码 的 速度 。 使 用 较 少 的 寄存 器 ， 编 译 器 将 被 迫 在 代 码 的 各 处 生成 装 入 和 存储 ; 
使 用 较 多 的 寄存 器 ， 大 部 分 的 存 取 只 出 现在 调用 点 。( 较 大 的 寄存 器 组 可 以 减 小 代码 中 总 的 存 取 数 量 。) 
把 保存 和 恢复 集中 在 调用 点 ， 编 译 器 有 机 会 以 比 在 整个 过 程 的 各 处 分 散 存 取 更 好 的 方法 来 处 理 它们 。 

1. 使 用 多 寄存 器 内 存 操作 

在 保存 和 恢复 相 邻 的 寄存 器 时 ， 编 译 器 通常 可 以 使 用 多 寄存 器 内 存 操作 。 很 多 体系 结构 支持 双 字 和 
四 倍 字 长 的 装 和 信和 存储 操作 。 这 可 以 减 小 代码 的 大 小 ; 也 可 以 改进 执行 速度 。 泛 式 多 寄存 器 装 入 和 多 寄 
存 器 存储 操作 有 相同 的 效应 。 

2. 使 用 库 例 程 


当 寄存 器 保存 和 恢复 操作 的 数量 增加 时 ， 调 用 前 序列 和 返回 后 序列 的 大 小 就 成 了 问题 。 编译 器 设计 ， 


者 可 以 用 对 编译 器 提供 的 保存 的 恢复 例 程 的 调用 来 取代 各 内 存 操作 的 序列 。 对 所 有 调用 都 这 样 做 ， 则 可 
以 有 效 地 碱 小 代码 的 大 小 。 因 为 保存 和 恢复 例 程 只 为 编译 器 所 知 ， 编 译 器 可 以 使 用 最 小 限度 的 调用 序列 
来 把 运行 时 成 本 保持 在 较 低 的 水 平 上 。 

保存 和 恢复 例 程 可 以 取 一 个 参数 ， 该 参数 指定 哪些 寄存 器 必须 被 保存 。 生 成 一 般 情 况 的 优化 版 本 很 
有 价值 ， 例 如 保存 所 有 调用 者 保存 寄存 器 或 被 调用 者 保存 寄存 器 。 

3. 结合 职责 

为 了 进一步 碱 小 额外 开销 ， 编 译 器 也 许 要 把 调用 者 保存 寄存 器 和 被 调用 者 保存 寄存 器 的 工作 结合 起 
来 。 在 这 一 方案 中 ， 调 用 者 把 一 个 指定 哪些 寄存 器 必须 被 保存 的 值 传 递 给 被 调用 者 。 而 被 调用 者 则 把 它 
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复 例 程 使 得 它 能 够 恢复 所 需 的 寄存 器 。 这 一 方法 把 额外 开销 限制 在 为 保存 寄存 器 的 一 个 调用 和 为 恢复 它 
们 的 一 个 调用 上 。 它 利用 调用 例 程 的 代价 分 离 了 调用 者 保存 和 被 调用 者 保存 的 责任 。 

编译 器 设计 者 必须 密切 注意 不 同 选择 的 代码 大 小 和 运行 时 速度 。 代 码 应 该 使 用 最 快 的 保存 和 恢复 操 
作 。 这 要 求 仔细 考察 目标 体系 结构 上 单 寄 存 器 操作 和 多 寄存 器 操作 的 代价 。 使 用 库 例 程 执行 保存 和 恢复 
可 以 节省 空间 ; 这 些 例 程 的 精心 实现 可 能 减少 调用 它们 的 附加 代价 。 


7.9.4 叶 过 程 的 优化 


编译 器 可 以 通过 叶 例 程 不 调用 其 他 过 程 的 事实 而 容易 地 识别 出 它们 来 。 可 以 裁减 叶 过 程 的 序言 序列 
和 结语 序列 来 消除 以 建立 序列 调用 为 惟一 目的 的 那些 操作 。 这 样 的 例子 包括 存储 返回 地 址 和 更 新 显示 ; 
上 述 两 种 操作 在 叶 过 程 中 都 是 不 需要 的 。( 如 果 寄 存 器 需要 保存 返回 地 址 或 存 取 链 接 ， 那 么 寄存 器 分 配 
器 腾 出 这 一 寄存 器 。) 

编译 器 也 许 还 能 够 简化 寄存 器 存储 的 行为 。 特 别 是 对 于 需要 较 少 寄存 器 的 较 小 叶 过 程 ， 编 译 器 可 以 
把 那些 值 放 入 调用 者 保存 寄存 器 中 ， 而 不 把 它们 保存 在 被 调用 者 保存 寄存 器 中 。 使 用 前 面 所 提出 的 库 保 
存 和 恢复 方法 , 有 可 能 做 进一步 的 优化 ; 如 果 叶 过 程 知 道 调用 者 保存 寄存 器 的 值 在 该 过 程 不 被 修改 的 话 ， 
那么 它 可 以 修改 调用 者 对 调用 者 保存 寄存 器 的 描述 。 在 这 一 方案 中 ， 叶 过 程 显 式 地 保存 它 需 要 保存 的 寄 
存 器 。 这 可 以 减少 在 调用 中 执行 的 保存 和 恢复 的 总 数量 ， 例 如 一 个 刚好 使 用 四 个 寄存 器 的 例 程 可 以 使 用 
内 联 代码 显 式 地 保存 它们 ， 而 不 去 调用 保存 和 恢复 例 程 。( 这 一 方案 可 能 完全 避免 调用 者 指定 的 保存 和 
恢复 。) 


7.10 实现 面向 对 象 语言 


正如 我 们 在 第 6 章 中 所 看 到 的 那样 ， 面 向 对 象 语言 与 类 Algol 语 言 之 间 的 主要 差异 在 于 把 名 字 映 射 到 
运行 时 对 象 的 机 制 不 同 。 实现 面向 对 象 语言 的 主要 困难 是 要 把 程序 为 寻找 方法 、 数据 成 员 和 其 他 对 象 而 
进行 的 遍历 的 运行 时 结构 链接 在 一 起 。 

从 生成 各 方法 的 代码 的 角度 考虑 这 一 问题 。 因 为 方法 可 以 存 取 任 意 成 为 其 接受 器 对 象 的 任意 成 员 ， 
所 以 编译 器 必须 给 统一 应 用 于 每 一 个 接受 器 的 每 一 个 成 员 建 立 一 个 偏 移 量 ， 即 为 可 以 找到 当前 方法 的 每 
一 个 对 象 建立 偏 移 量 。 当 编译 器 处 理 类 的 声明 时 ， 它 构建 这 些 偏 移 量 ， 类 中 的 对 象 本 身 不 包含 代码 。 下 
面 各 小 节 讨 论 若干 种 选择 。 


7.10.1 单一 类 ， 无 继承 


最 简单 的 情况 发 生 于 类 结构 在 编译 时 可 知 并 且 不 含有 继承 的 时 候 。 假 设 我 们 有 一 个 带 有 方法 fee、 
fie、foe 和 fum 以 及 数据 成 员 x 和 y 的 类 giant ， 其 中 x 和 y 都 是 数 。 为 了 简化 使 用 giant 的 程序 设计 ， 这 个 
类 维护 一 个 类 变量 n， 它 记录 已 创建 的 giant 的 数量 。 为 了 创建 对 象 ， 每 个 类 实现 方法 new， 它 定位 于 这 
个 类 的 方法 表 中 偏 移 量 为 0 的 地 方 。 编 译 器 必须 为 类 giant 的 每 一 个 实例 布局 对 象 记 录 ， 而 且 必 须 为 《类 
c1ass 的 实例 ) 类 giant 布局 一 个 对 象 记录 。 

giant 的 实例 的 对 象 记 录 是 一 个 长 度 为 三 的 向 量 。 这 一 向 量 的 第 一 个 槽 保存 这 个 槽 的 类 指针 ， 这 一 
指针 有 类 giant 的 具体 表示 的 地 址 。 其 余 两 个 槽 保存 数据 成 员 x 和 y。 类 giant 的 每 一 个 对 象 有 类 似 的 对 象 


O 在 这 一 方案 中 ， 存 储 所 有 被 保存 的 寄存 器 的 自然 地 点 是 被 调用 者 的 AR。 保 存 和 恢复 例 程 可 以 使 用 被 调用 者 
的 AR 来 存 取 寄 存 器 保存 区 域 。 





代码 形态 215 


记录 ， 这 些 记录 是 由 giant 的 方法 new 创 建 的 。 
giant 本 身 的 类 记录 必须 包含 它 的 所 有 类 变量 的 空间 ， 在 本 例 中 就 是 n 的 空间 ， 以 及 它 的 所 有 方法 的 
空间 。 概 念 上 ， 这 一 类 记录 包含 两 个 成 员 : 所 有 方法 的 人 口 点 地 址 表 ， 以 及 mn 的 一 个 槽 。 因 为 这 一 方法 
表 只 有 通过 地 址 来 引用 ， 所 以 可 以 把 它 内 联 地 分 配 成 这 一 类 记录 的 一 部 分 。 如 果 编 译 器 总 是 把 方法 表 放 
置 在 类 记录 中 一 个 固定 的 偏 移 量 处 ， 那 么 代码 就 可 以 容易 且 低 成 本 地 找到 这 一 方法 表 。 例 如 ， 可 以 对 类 
指针 和 适当 的 偏 移 量 使 用 1oadA0。 对 于 giant ， 编 译 器 可 能 在 记录 表 中 指定 下 面 的 偏 移 量 : 


new fee fie foe fum n 


偏 移 量 0 4 8 12 16 20 


giant 





giant 的 类 记录 中 的 方法 表 是 由 指向 每 一 个 方法 的 代码 的 指针 组 成 的 。 在 上 面 图 表 中 ， 我 们 不 是 显 式 地 
”表示 这 些 指针 ， 而 是 给 出 每 一 方法 名 的 混合 形式 。 为 了 从 过 程 名 计算 汇编 级 别 标签 ， 编 译 器 通常 加 入 程 
序 员 在 源 语言 中 不 能 使 用 的 字符 。 上 图 使 用 完整 限定 名 ， 并 对 这 些 名 字 加 入 一 个 百 分 号 (%) 作为 前 组 ， 
加 入 下 划 线 (-) 作为 后 缓 。 这 生成 易 计 算 、 相 容 的 标签 。 

数据 成 员 的 值 被 存储 在 适当 的 偏 移 量 处 。 为 了 区 分 它们 ， 我 们 分 别 把 joe .x。joe.y、fred.x 和 
fred.y 设 置 为 13、14、15 和 16。 因 为 存在 两 个 giant 实 例 ，giant.n 包 含 值 2。 如 果 程 序 包含 初始 化 数据 
成 员 的 代码 ， 那 么 编译 器 必须 在 new 方 法 中 包含 这 一 代码 。 

为 了 乔 清 事实 ， 考 虑 编译 器 为 giant 的 方法 new 生 成 的 代码 。 它 必须 为 一 个 新 对 象 记录 分 配 空 间 、 初 
始 化 每 一 个 数据 成 员 到 一 个 适当 的 值 、 递 增 giant .n 并 返回 指向 新 创建 的 对 象 记 录 的 指针 。 因 为 new 是 一 
个 完备 的 过 程 ， 它 还 需要 实现 链接 约定 ; 它 可 能 需要 保存 某 些 寄存 器 值 ， 创 建 一 个 活动 记录 ， 并 在 返回 
之 前 恢复 环境 。( 如 果 new 足 够 简单 ， 它 也 许 能 够 把 所 有 状态 保存 在 为 链接 而 保留 的 寄存 器 中 。) 编译 器 
使 用 它 的 混合 标签 %ginat .new_ 给 new 的 入 口 赋 标签 。 对 于 所 有 方法 ， 编 译 器 把 接受 器 的 指派 名 作为 它 的 
第 一 个 隐 式 参数 ， 如 果 没 有 明确 指定 ， 指 派 名 是 this。 

当 编 译 器 看 到 一 个 包含 giant 的 结构 时 ， 它 生成 的 代码 类 似 于 用 于 类 Algol 语 言 中 的 代码 。 例 如 ， 诸 
如 实例 化 giant 的 jane 二 jiant.new 这 样 的 语句 将 使 用 一 个 名 字 混 合 标 签 来 获得 giant 的 类 记录 的 地 址 ， 
并 生成 对 存储 于 该 地 址 中 的 地 址 的 过 程 调用 。9 

同样 地 ， 为 fum 调 用 joe 的 方法 的 表达 式 将 生成 一 个 对 %giant .fum_ 的 调用 并 以 joe 为 它 的 接受 者 。 
在 joe .fum 可 以 合法 出 现 的 所 有 上 下 文中 ，joe 必 须 映射 到 一 个 已 知 的 位 置 上 ， 即 一 个 地 址 可 被 计算 的 位 


W 
~g 
A 


日 、 如 果 编译 器 不 能 静态 地 分 配 giant 的 类 记录 ，、 那 么 它 可 能 需要 一 个 多 县 次 间接 形式 。 编 译 器 可 以 为 giant 创 
” 建 一 个 静态 的 全 局 变量 并 让 创建 qiant 的 类 记录 的 代码 把 适当 的 地 址 存储 到 那个 全 局 位 置 。 i 
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置 上 。 那 个 位 置 或 者 是 joe 的 对 象 记录 的 开始 ， 或 者 包含 指向 joe 的 对 象 记录 的 指针 。( 它们 必须 能 够 由 
调用 的 上 下 中 的 类 型 信息 来 区 分 。) 编译 器 生成 把 这 个 地 址 装 人 joe 的 对 象 记录 中 偏 移 量 为 零 处 的 代码 ; 
这 指向 giant 的 类 记录 的 开始 。 编 译 器 生成 把 这 个 字 装 和 人 类 记录 中 偏 移 量 为 16 的 代码 ， 在 这 里 编译 器 发 
现 %giant.fum- 的 地 址 。 最 后 ， 编 译 器 生成 对 这 一 地 址 的 过 程 调 用 ， 并 把 joe 的 地 址 隐 式 地 传递 给 参数 
this。 使 用 过 程 链 接 的 标准 技术 来 处 理 其 他 参数 。 . 

为 了 创建 其 他 类 ， 编 译 器 遵循 同样 的 步骤 。 它 在 实例 的 对 象 记录 和 类 记录 中 指定 偏 移 量 。 使 用 这 些 
偏 移 量 和 通过 对 适当 的 对 象 记录 的 间接 引用 ， 编 译 器 编译 方法 。 它 使 用 名 字 混 合 来 为 每 个 过 程 和 类 记录 
创建 不 同 的 标签 。 它 使 用 适当 的 标签 进行 静态 初始 化 来 填充 方法 表 。 


7.10.2 单一 继承 


继承 在 几 个 方面 使 面向 对 象 语言 的 实现 复杂 化 。 每 个 类 的 类 记录 需要 几 个 额外 的 成 员 。 因 为 继承 ， 
寻找 和 调用 方法 的 机 制 必须 以 可 存 取 的 方式 定位 方法 。 最 后 ， 为 使 这 些 方 法 运作 起 来 ， 每 个 实例 的 对 象 
记录 必须 包含 所 有 由 超 类 指定 的 实例 变量 。 类 和 对 象 记录 中 的 额外 成 员 的 加 入 是 显然 的 ;加 入 额外 的 方 
法 需要 更 多 的 工作 。 

使 用 继承 ， 程 序 员 可 以 使 用 不 同 的 方法 来 实现 类 giant。 图 7-13 给 出 一 个 这 样 的 实现 。 由 于 继承 ， 
一 个 类 的 对 象 记 录 现 在 有 一 个 类 指针 ; 这 个 类 指针 是 类 对 象 记录 的 第 一 个 成 员 。 所 有 类 的 对 象 记录 的 
第 二 个 成 员 是 它 的 超 类 指针 。 这 一 超 类 指针 显示 giant 是 mc 的 一 个 子 类 ， 而 mc 又 是 sc 的 一 个 子 类 。 考 察 
图 7-13 可 知 每 个 类 都 实现 new。 除 c1ass 外 的 所 有 类 都 实现 fee。Giant 从 mc 继承 foe ， 从 sc 继承 fum。 





图 7-13 实现 继承 


如 果 类 的 结构 是 固定 且 已 知 的 ， 那 么 通过 在 每 个 类 中 加 入 一 个 完整 的 方法 表 ， 编 译 器 可 以 简化 方 
法 调度 的 实现 。 在 这 一 方案 中 ， 对 于 任意 的 方法 ， 可 以 使 用 接受 器 的 类 指针 和 类 的 方法 表 中 该 方法 的 
偏 移 量 来 调用 该 方法 。 这 样 避免 遍历 继承 层次 的 额外 间接 寻 址 。 如 果 类 结构 在 运行 时 是 可 变 的， 那么 
编译 器 仍 可 以 设法 使 用 完整 的 方法 表 。 为 了 实现 这 一 点 ， 编 译 器 必须 提供 在 运行 时 构建 方法 表 的 机 制 。 
这 一 机 制 用 于 在 执行 的 开始 构建 初始 方法 表 。 当 类 结构 改变 时 它 被 重新 调用 〈 例 如 ， 在 Java 中 类 装 和 人 器 
装 入 新 类 时 )。 为 了 使 这 一 工作 更 高 效 ， 编 译 器 设计 者 应 该 避免 重新 计算 类 层次 中 没有 发 生变 化 的 部 分 
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的 方法 表 。 

如 果 编 译 器 不 能 设法 使 用 完整 的 方法 表 ， 那 么 代码 可 能 需要 把 在 类 层次 中 进行 查找 的 工作 作为 每 个 
方法 调度 的 一 个 部 分 。 例 如 ， 如 果 语 言 允 许 在 运行 时 创建 新 类 ， 那 么 可 能 就 需要 进行 动态 调度 。 在 这 种 
情况 下 ， 编 译 器 必须 通过 按 祖先 序 搜索 每 个 类 的 方法 表 来 实现 方法 查找 。 这 将 戏剧 性 地 增加 每 一 次 调用 
的 代价 。 i 

为 了 执行 动态 方法 查找 ， 编 译 器 必须 把 每 个 方法 名 映射 到 一 个 搜索 键 。 这 一 映射 可 以 很 简单 ， 使 用 
这 个 方法 的 名 字 或 这 个 方法 名 字 的 散 列 索引 作为 键 。 这 一 映射 也 可 以 很 复杂 ， 编 译 器 可 能 使 用 链接 时 机 
制 从 某 个 紧 集 为 每 个 方法 名 指定 一 个 整数 。 无 论 哪 种 情况 ， 编 译 器 都 必须 生成 一 个 在 运行 时 可 以 搜索 的 
表 来 寻找 由 这 个 接受 器 的 类 的 最 近 祖 先 实现 的 这 一 方法 的 实例 。 

为 了 改进 这 一 环境 下 的 方法 查找 ， 运 行 时 系统 可 以 实现 一 个 方法 缓冲 ， 即 大 多 数 现代 处 理 器 上 的 硬 
件数 据 缓冲 的 一 个 软件 模拟 。 方法 缓冲 有 较 少 的 人 口 ， 例 如 1000 人 个。 缓冲 人 口 由 一 个 键 、 一 个 类 和 一 个 
方法 指针 组 成 。 键 是 包含 类 和 方法 搜索 键 的 序 对 。 方 法 查找 首先 在 缓冲 器 中 查找 带 有 该 方法 的 搜索 键 和 
接受 器 类 的 入 口 。 如 果 该 入 口 存在 ， 查 找 返 回 被 缓冲 的 方法 指针 。 如 果 入 口 不 存在 ， 查 找 执行 完整 的 搜 
索 ， 搜索 开始 于 接受 器 的 类 并 沿 着 超 类 链 向 上 搜索 ， 直 到 它 找到 方法 搜索 键 。 在 找到 方法 搜索 键 这 一 点 ， 
查找 为 当前 搜索 的 结果 创建 一 个 新 的 缓冲 和 人 日 ， 并 返回 方法 指针 。 

当然 ， 新 人 口 的 创建 也 许 将 迫使 其 他 缓冲 器 人 日 的 逐 出 。 诸 如 最 近 最 少 使 用 或 循环 复 用 等 标准 缓 
神 替 换 策 略 可 以 用 于 选择 替换 的 人口 。 更 大 的 缓冲 器 保留 更 多 的 信息 ， 但 是 需要 更 多 内 存 ， 并 且 可 能 
花费 更 长 的 时 间 来 搜索 。 在 任意 改变 类 结构 的 操作 点 ， 我 们 要 清除 方法 缓冲 以 防止 查找 找到 不 正确 的 
结果 。 

1. 布局 对 象 记录 

继承 的 实现 影响 着 编译 器 必须 布局 对 象 记 录 的 方式 。 为 使 继承 正常 工作 ， 对 象 必 须 能 作为 它 自 身 的 
类 或 它 的 超 类 中 定义 的 方法 的 接受 器 正确 地 工作 。 这 规定 了 这 一 对 象 的 数据 成 员 出 现 的 顺序 。 如 果 fred 
是 类 mc 的 方法 的 接受 器 ， 那 么 这 一 方法 只 知道 fred 从 mc 和 mc 的 祖先 继承 下 来 的 实例 变量 。 然 而 ， 为 使 屠 
些 继承 来 的 方法 工作 ， 那 些 实例 变量 在 giant 的 实例 中 和 在 mc 的 实例 中 的 偏 移 量 必 须 相 同 。 否 则 ， 当 使 
用 fred 或 joe 作 为 接受 器 调用 mc 的 方法 时 ， 该 方法 将 引用 错误 的 值 。 

这 一 般 表 明 各 成 员 要 以 继承 的 顺序 来 布局 。 在 类 giant 的 对 象 jim 的 对 象 记 录 中 的 最 前 面 的 实例 变量 
是 从 sc 的 定义 而 来 的 ， 后 面 跟着 从 mc 的 定义 而 来 的 实例 变量 ， 后 面 再 跟着 从 giant 的 定义 而 来 的 实例 变 
量 。 这 导致 下 面 的 布局 : 


giant 
类 指针 sc 数据 成 员 mc 数据 成 员 | 数据 成 员 


现在 ， 存 在 于 超 类 链 中 的 每 一 个 实例 变量 在 每 一 个 类 中 都 有 相同 的 偏 移 量 。9 
同样 的 想法 也 适用 于 方法 表 的 布局 。 在 对 每 一 个 类 中 都 使 用 完整 方法 表 的 系统 中 ， 有 一 个 从 方法 名 





到 相对 于 层次 链 的 偏 移 量 的 相 容 映射 是 至 关 重要 的 。 任 意 类 ， 如 类 new 中 出 现 的 方法 总 有 相同 的 偏 移 量 。 


保证 这 一 点 的 简单 方法 是 遵循 与 前 面 所 述 的 对 数据 成 员 的 方法 表 的 偏 移 量规 则 同样 的 规则 。 定 义 在 当前 
类 中 的 方法 位 于 其 方法 表 的 末端 ， 它 的 前 面 是 立即 超 类 的 方法 ， 如 此 沿 继承 链 一 直 往 上 推 。 然 而 ， 当 一 


日 ”这 一 观察 的 一 个 推论 是 每 个 类 的 对 象 记录 必 须 包含 类 class 的 声明 中 定义 的 所 有 实例 变量 。 这 一 结论 并 没有 
反映 在 上 面 的 图 中 。 
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个 类 声明 由 其 某 个 超 类 所 定义 的 方法 的 一 个 新 实现 时 ， 这 一 实现 的 方法 指针 必须 存储 于 与 该 方法 的 前 面 
实现 相同 的 偏 移 量 处 。 

2. 多 重 继承 

在 共享 方法 和 数据 时 ， 为 了 向 程序 员 提 供 更 大 的 灵活 性 ， 一 些 面向 对 象 语言 允许 一 个 类 直接 从 多 个 
超 类 继承 而 来 。 这 些 语言 通常 放松 对 单一 遗传 层次 的 包含 要 求 ， 一 个 类 可 以 从 超 类 继承 一 部 分 而 不 是 全 
部 方法 。 这 需要 一 个 语言 学 上 的 机 制 来 精确 地 指定 从 一 个 超 类 中 继承 哪些 成 员 。 

多 重 继承 进一步 复杂 化 布局 对 象 记录 的 问题 。 如 果 类 c 是 从 a 和 b 继 承 而 来 的 ， 但 是 a 和 b 在 继承 层次 
上 不 相关 ， 那 么 编译 器 必须 设计 一 个 能 够 对 来 自 于 这 两 个 类 的 方法 进行 正确 操作 的 对 象 记 录 。 这 要 求 额 
外 的 支持 来 调整 环境 ， 以 使 单一 方法 的 实现 既 适 用 于 类 4b 的 实例 也 适用 于 类 c 的 实例 。 

假设 类 c 实 现 fee ， 从 a 继承 fie， 且 从 b 继 承 foe 和 fum。 单 一 继承 的 对 象 布 局 适用 于 在 三 个 类 中 的 两 
个 类 ， 例 如 a 和 c。 


类 指针 a 数据 成 员 b 数 据 成 员 < 数据 成 员 


我 们 的 布局 规则 首先 放置 一 个 超 类 ， 在 此 例 中 为 4， 而 最 后 放置 目前 的 类 ， 即 此 例 中 的 c。 当 使 用 这 
一 对 象 记录 调用 a 的 方法 时 ， 它 在 期 望 的 偏 移 量 处 找到 a 的 所 有 实例 变量 。 因 为 该 方法 是 用 a 的 类 定义 而 
不 是 用 b 或 c 的 类 定义 来 编译 的 ， 所 以 它 不 能 存 取 存在 的 所 有 实例 变量 ， 因 为 它们 可 能 是 从 5b 继承 而 来 或 
直接 从 类 c 的 定义 而 来 的 。 因 此 这 一 方法 将 正确 地 发 挥 功能 。 

同样 地 ， 当 以 这 一 对 象 记录 为 接受 器 调用 作为 c 的 一 部 分 被 编译 的 方法 时 ， 这 一 方法 将 发 现 所 有 实 
例 变量 都 在 它们 所 希望 的 位 置 上 。 因 为 c 的 描述 包含 它 的 继承 的 描述 ， 所 以 编译 器 知道 每 个 实例 变量 在 
对 象 记录 中 的 位 置 。 

当 调 用 4b 的 方法 时 发 生 问 题 。 对 象 记录 中 的 实例 变量 因为 是 从 5b 继承 而 来 的 ， 所 以 它们 是 在 错误 的 位 
置 上 ; 它们 处 于 距 对 象 记录 的 开始 位 置 偏 移 量 为 a 的 实例 变量 的 累加 长 度 的 地 方 。 为 了 补偿 这 一 偏 移 量 ， 
并 让 一 个 使 用 b 编 译 的 方法 正确 发 挥 功能 ， 编 译 器 必须 插入 代码 来 调整 接受 器 指针 ， 使 得 这 一 指针 指向 
对 象 记录 的 中 部 ， 指 向 6 的 实例 变量 的 适当 位 置 。 

为 了 调整 偏 移 量 ， 编 译 器 有 两 个 选择 。 它 可 以 在 对 象 记录 中 记录 常量 调整 值 ， 并 使 用 总 是 把 一 个 偏 
移 量 加 到 接受 器 指针 this 的 链接 约定 。 这 对 每 次 调用 增加 一 个 装 和 人 和 一 个 加 法 ,这 是 一 个 小 代价 。 另 外 ， 
编译 器 也 可 以 为 类 b 的 每 个 方法 创建 一 个 所 谓 的 踏 床 函 数 〈trampoline function )， 这 是 一 个 使 this 增 加 所 
需 量 ， 然 后 调用 8 的 当前 方法 的 函数 。 如 果 需 要 的 话 〈( 即 如 果 接 受 器 是 由 引用 传递 的 话 ) ， 它 也 可 能 减少 
这 一 接受 器 指针 。 这 把 一 个 过 程 调用 加 入 调用 链 上 ， 这 比 装 人 和 加 法 的 代价 要 大 。 使 用 蹦床 函数 的 c 的 
类 记录 如 图 7-14 所 示 。 





图 7-14 使 用 蹦床 函数 的 多 重 继承 
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有 两 个 事实 使 蹦床 函数 值得 考虑 。 第 一 ， 它 们 只 在 对 由 2 继承 而 来 的 方法 的 调用 上 引发 代价 。 而 对 [379 
和 ec 的 方法 的 调用 不 会 引发 代价 。 第 二 ， 蹦 床 函 数 可 以 比 装 入 和 加 策略 优化 得 更 好 。 面 向 对 象 语言 的 优 
化 通常 包含 大 量 的 内 联 赫 换 。 因 为 蹦床 函数 是 类 特定 的 ， 所 以 偏 移 量 以 文字 常量 出 现 。 这 消除 内 存 引 
M: 使 用 内 联 替换 ， 负 荷 减 小 到 一 个 装 入 立即 和 一 个 加 法 ， 而 这 些 只 出 现在 对 5 的 方法 的 调用 中 。 与 接 
受 c 中 所 有 可 视 方法 的 所 有 调用 相 比 ， 蹦 床 函 数 可 能 产生 更 快 的 代码 。 

作为 最 后 的 调整 ， 编 译 器 也 可 能 需要 插入 一 个 类 指针 的 副本 。 这 样 ， 由 ?编译 而 来 的 方法 可 以 在 它 
的 2 实例 变量 的 前 面 立 即 找到 这 一 类 指针 。 这 一 类 指针 应 该 指向 c， 从 而 由 c 中 的 定义 掩盖 起 来 的 p 中 的 任 
意 方法 都 可 以 解析 到 正确 的 方法 指针 。 

3. 对 象 记 录 的 形态 

因为 编译 器 必须 在 指定 的 偏 移 量 上 放置 代码 和 数据 成 员 ， 所 以 这 一 转换 为 类 创建 这 样 的 对 象 记录 ， 
在 其 中 方法 和 实例 变量 是 交替 出 现 的 。 这 不 会 引发 错误 ， 因 为 编译 器 知道 每 一 个 引用 的 正确 偏 移 量 。 如 
果 < 是 从 ?继承 而 来 的 ， 而 2 又 是 从 “继承 而 来 的 ， 那 么 类 < 的 对 象 记录 如 下 所 示 : 


其 中 ， 每 个 类 的 方法 后 面 紧 跟着 那个 类 的 类 变量 。 380 


7.11 概括 和 展望 


编译 器 设计 者 面临 的 更 微妙 的 任务 之 一 是 为 实现 每 一 个 源 语言 结构 选择 目标 机 器 操作 的 模式 。 对 几 
平 所 有 的 源 语言 语句 都 有 多 种 实现 策略 。 在 编译 器 设计 时 所 做 的 特定 选择 对 编译 器 生成 的 代码 有 重要 的 
影响 。 

在 非 商用 编译 器 中 ， 即 在 调试 编译 器 或 学 生 编译 器 中 ， 编 译 器 设计 者 也 许 选择 易于 实现 翻译 并 产生 
简洁 代码 的 策略 。 而 在 优化 编译 器 中 ， 编 译 器 设计 者 应 该 关注 于 那些 给 编译 器 的 后 期 阶段 ， 即 低级 优化 、 
指令 调度 以 及 寄存 器 分 配 等 展示 尽 可 能 多 的 信息 的 翻译 。 这 两 种 不 同 的 观点 导致 循环 的 不 同形 态 ， 命 名 
临时 变量 的 不 同 规则 以 及 表达 式 的 不 同 评估 顺序 。 

这 一 差异 的 典型 例子 可 能 是 选择 (case) 语句 。 在 调试 编译 器 中 ， 可 以 以 联 级 if-~then-e1se 机 构 
来 实现 它 。 而 在 优化 编译 器 中 ， 众 多 的 测试 和 分 支 的 低 效率 使 得 更 复杂 的 实现 方案 更 有 价值 。 改 进 选 择 
语句 的 努力 必须 在 最 初生 成 耻 时 就 进行 ; 很 少 有 优化 器 把 一 系列 联 级 条 件 语句 转化 成 二 分 搜索 或 直接 跳 
转 表 。 


本 章 注释 


本 章 所 包含 的 素材 大 致 属于 两 个 范畴 : 为 表达 式 生 成 代码 和 处 理 控制 流 结构 。 表 达 式 评估 在 文献 中 
已 有 很 好 的 阐述 。 如 何 处 理 控 制 的 讨论 却 很 少 ， 本 章 中 关于 控制 流 的 大 部 分 素材 来 自 于 非 正式 的 交流 、 
经 验 和 对 编译 器 输出 的 仔细 阅读 。 

Floyd 提 出 了 第 一 个 根据 表达 式 树 生成 代码 的 多 遍 算 法 [143]。 他 指出 元 余 消 除 和 代数 重组 有 可 能 改 
进 他 的 算法 的 结果 。Sethi 和 Uliman[30] 提 出 对 于 简单 机 器 模型 最 优 的 两 遍 算 法 Proebsting 和 Fischer 扩 
展 了 这 一 工作 ， 得 到 较 小 的 内 存 等 待 [278]。Aho 和 Johnson[5]3 引 人 动态 规划 来 寻找 最 小 代价 的 实现 。 

科学 计算 程序 中 的 数组 计算 的 优势 导致 对 数组 寻 址 表达 式 的 研究 和 改进 它们 的 优化 〈 如 10.3.3 节 中 


w 
oo 
bat, 
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的 强度 减弱 )。7.5.3 节 中 所 描述 的 计算 来 自 于 Scarborough 和 Kolsky 的 研究 [297]。 
Harrison 把 申 操 作 作 为 推广 内 联 起 换 和 特 化 的 启发 性 例子 [174]。7.6.4 节 结束 时 所 提 到 的 例子 来 自 上 
述 论 文 。 | 
Mueller 和 Whalley 描 述 不 同 循环 形态 对 性 能 的 影响 [263]。Bernstein 给 出 了 选择 语句 的 代码 生成 中 的 
各 种 选择 的 详细 讨论 [38]。 调 用 约定 在 各 处 理 器 和 各 操作 系统 的 操作 手册 中 得 到 最 好 的 阐述 。 


第 8 章 
代码 优化 概述 


8.1 概述 


编译 器 中 间 部 分 ， 或 优化 器 的 目标 是 把 由 前 端 创建 的 似 程 序 转换 成 以 更 好 的 方式 计算 相同 结果 的 IR 
程序 。 这 里 ,“ 更 好 ”可 以 有 很 多 含义 。 它 通常 指 更 快 的 代码 ， 但 是 它 也 可 能 指 更 简洁 的 代码 。 程 序 员 
也 许 想 要 优化 器 生成 在 运行 时 消耗 更 少 电力 的 代码 ， 或 者 在 考虑 资源 的 模型 下 运行 成 本 更 低 的 代码 。 所 
有 这 些 目标 都 属于 优化 的 领域 。 
优化 的 机 会 来 自 方方面面 。 为 了 使 这 一 讨论 更 具体 ， 考 虑 在 实现 源 语 言 抽 象 时 可 能 出 现 的 低 效 问题 。 
因为 前 端 把 源 代码 翻译 成 IR 时 通常 不 对 周围 上 下 文 进行 大 量 的 分 析 ， 它 通常 生成 的 是 处 理 某 个 结构 的 最 
一 般 情况 的 IR。 优 化 器 可 以 通过 执行 额外 的 分 析 来 确定 某 些 上 下 文 ; 遗憾 的 是 ， 某 些 上 下 文 在 编译 时 是 
不 可 知 的 。 
考虑 当 编译 器 必须 为 诸如 AL[i，j] 这 样 的 数组 引用 生成 代码 时 所 发 生 的 事情 。 在 没有 A、i、j 及 周围 
上 下 文 的 特别 信息 的 情况 下 ， 编 译 器 必须 生成 对 二 维 数组 进行 寻 址 的 完整 表达 式 。 正 如 我 们 在 第 7 章 中 
所 看 到 的 那样 ， 这 一 计算 的 形式 如 下 所 示 。 
address(A) 
+ (i - low, (A)) x (high2(A) — low2(A) + 1) x size 
+ (j — low2(A)) x size 


其 中 ，address 是 这 一 数组 的 第 一 个 元 素 的 运行 时 地 址 ，low;(A) Filhigh(A) 分 别 是 A 的 第 i 维 的 下 界 和 
上 界 ，size 是 A 的 元 素 的 大 小 。 这 一 计算 成 本 很 高 。 编 译 器 改进 这 一 代码 的 能 力 直 接 取决 于 它 对 这 一 代码 
和 周围 上 下 文 的 分 析 。 

如 果 A 是 局 部 声明 的 ， 且 有 已 知 的 边界 和 类 型 ， 那 么 正如 7.5 节 中 所 讨论 的 那样 ， 编 译 器 通常 可 以 在 
编译 时 执行 这 一 地 址 计算 的 大 部 分 任务 ， 并 在 运行 时 使 用 这 一 结果 。 例 如 ， 项 : 


(high2(A) — low2(A) + 1) x size 


可 以 在 编译 时 计算 ， 并 处 理 为 运行 时 常量 (例如 ， 使 用 1oadI )。 上 述 地 址 计算 的 其 余部 分 也 可 以 得 到 改 
进 ， 参 见 7.5 节 。 

如 果 编 译 器 能 够 识别 出 对 A[i，j] 的 引用 是 发 生 在 i 和 j 以 有 序 的 方式 变化 的 循环 嵌 套 的 内 部 ， 那 么 
编译 器 可 以 用 加 法 取代 上 述 计算 中 的 整数 乘法 。 这 一 转换 称 为 操作 符 强 度 减 弱 (operator strength 
reduction ) 。 强 度 减 弱 使 用 序列 癌 ， 癌 ， 忆 ，… 取 代 序 列 k, (+1) k, G4+2)-k, =, $p, H Fm>0, 
ih=i- 大 且 站 = 六 -十 上 。 当 程序 运行 时 ， 它 执行 更 多 的 加 法 和 更 少 的 乘法 。 如 果 乘 法 的 代价 比 加 法 大 ， 那 
么 这 一 新 序列 就 是 一 个 改进 。 

有 时 候 ， 编 译 器 无 法 发 现 改 进 代码 的 事实 。 如 果 j 的 值 是 从 诸如 文档 或 键盘 这 样 的 外 部 设备 读 取 的 ， 
那么 编译 器 无 法 改进 计算 A[i,，j] 地 址 的 代码 。 在 这 样 的 环境 下 ， 编 译 器 必须 生成 可 以 处 理 任意 合法 情 





Ww 
Ww 
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况 的 代码 。 它 可 能 还 必须 生成 发 现 诸如 j > high,(A) 的 不 合法 情况 的 代码 。 


这 一 简单 例子 既 展 示 了 优化 的 动机 ， 也 展示 了 代码 优化 器 的 基本 操作 。 


代码 优化 的 目标 是 在 编译 时 发 现 程序 的 运行 时 行为 的 信息 ， 并 使 用 这 一 信息 改进 编译 器 生 

成 的 代码 。 

改进 可 以 采用 多 种 形式 。 前 面 的 例子 都 集中 于 优化 的 最 一 般 目 标 : 加 速 已 编译 代码 的 执行 。 然 而 对 
于 某 些 应 用 ， 已 编译 代码 的 大 小 是 重要 的 。 这 样 的 例子 包括 被 提交 给 只 读 内 存 的 代码 ， 而 内 存 的 大 小 受 
到 经 济 上 的 约束 ， 或 者 在 执行 前 要 在 限 宽 通信 信道 中 传递 的 代码 ， 而 此 时 代码 的 大 小 直接 影响 完成 工作 
的 时 间 。 对 于 这 些 应 用 ， 优 化 应 该 生成 占据 较 少 空间 的 代码 。 在 某 些 情 况 下 ， 用 户 想 要 按 其 他 标准 进行 
优化 ， 例 如 寄存 器 使 用 、 内 存 的 使 用 、 能 量 消耗 或 实时 事件 的 响应 时 间 等 标准 。 

历史 上 ， 优 化 编译 器 主要 带 焦 于 编译 代码 的 运行 时 速度 。 我 们 关于 优化 的 大 部 分 讨论 将 考虑 速度 问 
题 。 对 速度 的 强调 常常 带 来 空间 成 本 的 增加 ， 由 于 复制 操作 而 引发 更 大 的 代码 。 这 就 是 算法 设计 中 典型 
的 时 间 和 空间 的 权衡 问题 。 鉴 于 在 嵌入 式 和 交互 式 计算 中 代码 空间 和 数据 空间 的 重要 性 的 增加 ， 我 们 将 
集中 讨论 某 些 减 小 程序 对 空间 的 需求 ， 或 者 至 少 不 显著 增加 空间 需求 的 技术 。 

优化 是 一 个 巨大 、 细 节 性 的 课题 。 本 章 以 及 后 面 两 章 将 对 这 一 课题 给 出 概述 性 的 介绍 。 本 章 英 定 基 
础 工作 。 其 他 书籍 对 此 给 出 了 更 深 、 更 细致 的 讨论 [262，260，19]。 下 一 节 考 查 LINPACK 的 一 个 例 程 ， 
LINPACK 是 一 个 人 们 熟知 的 库 ， 它 为 数值 线性 代数 中 的 很 多 算法 提供 高 效 实现 。 下 一 节 利 用 这 一 例 程 
揭示 深入 研究 这 一 问题 及 代码 改进 技术 所 需 的 一 些 概念 。 本 章 的 其 余部 分 给 出 代码 优化 中 的 一 个 典型 问 
题 ， 即 寻找 和 消除 元 余 表 达 式 的 问题 ， 并 使 用 这 一 上 典型 问题 说 明 优化 的 机 会 和 挑战 。 

接 下 来 的 两 章 更 深入 地 研究 程序 分 析 和 转换 的 问题 。 第 9 章 给 出 静态 分 析 的 总 论 。 它 阐述 优化 编译 
器 必须 解决 的 分 析 问 题 ， 并 给 出 解决 这 些 问 题 时 使 用 的 实际 技术 。 第 10 章 展示 单 处 理 器 机 器 上 的 优化 分 
类 ， 并 对 各 范畴 使 用 一 个 实例 转换 来 详 述 这 一 分 类 。 


8.2 背景 知识 


直到 20 世 纪 80 年 代 初 期 ， 很 多 编译 器 设计 者 把 优化 认为 是 只 有 当 编译 器 的 其 他 部 分 都 能 很 好 工作 之 
后 才 应 该 加 入 的 性 质 。 这 导致 调试 编译 器 (debugging compiler) 与 优化 编译 器 (optimizing compiler) 
之 间 的 差异 。 调 试 编译 器 以 代码 质量 为 代价 强调 快速 编译 。 这 些 编译 器 对 代码 不 做 本 质 上 的 重新 调整 ， 
所 以 源 代码 与 执行 代码 之 间 保 留 着 很 强 的 对 应 关系 。 这 简化 了 把 运行 时 错误 上 映射 到 源 代 码 特定 行 的 任 
务 ; 因此 就 有 了 调试 编译 器 的 说 法 。 与 其 相反 ， 优 化 编译 器 致力 于 以 编译 时 间 为 代价 改进 可 执行 代码 的 
运行 时 间 。 在 编译 中 花费 更 多 的 时 间 通 常 产生 更 好 的 代码 。 因 为 优化 器 通常 要 移动 操作 ， 所 以 从 源 代码 
到 可 执行 代码 的 映射 更 加 人 缺少 透明 度 ， 而 且 相 应 地 ， 调 试 更 加 困难 。 

随 着 RISC 处 理 器 推 向 市 场 ( 以 及 随 着 RISC 的 实现 技术 被 应 用 于 CISC 的 体系 结构 )， 改 进 运行 时 性 
能 的 大 部 分 负担 落 到 编译 器 的 身上 。 为 了 增强 性 能 ， 处 理 器 设计 师 转向 需要 编译 器 更 多 支持 的 性 质 的 研 
究 上 。 这 些 性 质 包 含 分 支 上 的 等 待 槽 、 无 阻塞 内 存 操作 、 增 设 管道 使 用 以 及 增加 功能 单元 的 数量 。 处 理 
器 对 程序 布局 和 结构 这 样 的 高 层次 问题 以 及 调度 和 资源 分 配 的 细节 这 样 的 低层 次 问题 都 变 得 更 加 性 能 敏 
感 。 随 着 由 优化 所 带 来 的 性 能 差异 的 增加 ， 对 代码 质量 的 期 望 值 也 在 增加 ， 以 至 于 优化 已 经 成 为 现代 编 
译 器 的 必要 部 分 。 ， 

优化 器 的 例 程 的 加 入 反 过 来 改变 前 端 和 后 端的 操作 环境 。 优 化 进一步 把 前 端 从 性 能 的 考虑 分 离开 来 。 
在 某 种 程度 上 ， 这 可 简化 前 端 生成 蕊 的 任务 。 与 此 同时 ， 优 化 改变 后 端 处 理 的 代码 。 现 代 优 化 器 假设 后 


" 端 将 处 理 资源 分 配 ， 因 此 ， 它 们 一 般 都 以 对 寄存 器 、 内 存 和 功能 单元 不 加 以 限制 的 理想 机 器 为 目标 。 从 
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而 ， 反 过 来 这 对 用 于 编译 器 后 端的 技术 产生 更 大 的 压力 。 

如 果 编 译 器 要 承担 运行 时 效率 的 责任 ， 那 么 它们 必须 包含 优化 器 。 正 如 我 们 将 看 到 的 那样 ， 优 化 的 
工具 还 在 编译 器 后 端 扮演 重要 的 角色 。 出 于 这 些 原 因 ， 在 讨论 用 于 编译 器 后 端的 技术 之 前 引入 优化 并 揭 
示 优 化 引发 的 问题 是 非常 重要 的 。 


8.2.1 LINPACK 的 一 个 例子 


为 了 理解 优化 实际 程序 所 引发 的 某 些 问题 ， 考 虑 图 8-1 所 给 出 的 代码 片段 ， 这 一 代码 片段 来 自 于 
LINPACK 数 值 库 中 的 dmxpy 例 程 的 FORTRAN 版 本 。 这 一 供 套 隐藏 着 围绕 单一 长 赋值 的 两 个 循环 ， 而 这 
一 长 赋值 形成 对 向 量 x 和 y 以 及 矩阵 nm 计算 y+x x m 的 例 程 的 核心 。 从 两 个 不 同 观点 考虑 这 一 代码 是 有 益 的 : 
第 一 个 观点 是 设计 者 尝试 改进 性 能 的 手工 转换 ;第 二 个 观点 是 ， 编 译 器 为 了 在 特定 处 理 器 上 高 效 运行 而 
翻译 这 一 循环 供 套 时 所 面临 的 挑战 。 


subroutine dmxpy (nl, y, n2, ldm, x, m) 
double precision y(*), x(*), m(1dm,*) 


jmin = j+16 
do 60 j = jmin, n2, 16 
do 50 i = 1, nl 
yi) = AUUE (yi) 
+ x(j-15)*m(i,j-15)) + x(j-14)*m(i,j-14)) 
+ x(j-13)*m(i,j-13)) + x(j-12)*m(i,j-12)) 
+ x(j-11)*m(i,j-11)) + x(j-10)*m(i,j-10)) 
+ x(j- 9)*m(i,j- 9)) + x(j- 8)*m(i,j- 8)) 
+ x(j- 7)*m(i,j- 7)) + x(j- 6)*m(i,j- 6)) 
+ x(j- 5)*m(i j- 5)) + x(j- 4)*m(i j- 4)) 
+ x(j- 3)*m(i j- 3)) + x(j- 2)*m(i,j- 2)) 
+ x(j- 1j*m(i j- 1)) + x(j) *m(i, 5) 
continue 60 continue 


$ 
$ 
$ 
$ 
$ 
$ 
$ 
$ 


end 





图 8-1 .LINPACK 中 dmxpy 的 摘录 
在 设计 者 动手 转换 代码 之 前 ， 这 一 循环 嵌 套 执行 一 个 上 述 计 算 的 更 简单 形式 ， 其 计算 如 下 : 


do 60 j = 1，n2 
do 50 i = 1, nl 
y(i) = y(i) + x(j) * m(i,j) 
50 continue 
60 continue 


为 了 改进 性 能 ， 外 循环 已 经 被 展开 (unrolled)。 在 原来 循环 体 中 的 语句 是 y(1)=y(1)+x(j)*m(1，j)。 
对 于 j 的 不 同 值 ， 这 一 循环 体 创建 范围 从 j 到 j - 15 的 16 份 拷贝 。 外 循环 的 增 量 从 1 变 成 16。 这 16 个 循环 体 
被 嵌入 到 单一 语句 中 ， 消 除 15 个 加 靶 〈y(i)+… 的 各 个 出 现 ) 以 及 y(i) 的 大 部 分 装 入 和 存储 。 

图 8-1 所 示 的 循环 代 套 的 前 面 还 有 其 他 四 个 循环 区 套 版 本 。 这 些 循环 媒 套 处 理 当 n2 不 是 16 的 倍数 的 
情况 。 具 体 的 行为 是 ， 它 们 最 多 处 理 m 的 15 行 ， 使 j 成 为 一 个 使 n2-j 是 16 的 整数 倍 的 值 。 第 一 个 循环 处 理 
m 的 单一 行 ， 对 应 于 n2 为 奇数 的 情况 。 其 他 三 个 循环 企 套 处 理 m 的 2、4 和 8 行 。 这 保证 如 图 8-1 所 示 的 最 后 
一 个 循环 嵌 套 可 以 一 次 处 理 16 行 。 

理想 地 ， 编 译 器 应 该 能 够 把 原来 的 循环 做 套 转 化 成 更 高 效 的 版 本 ， 或 者 转换 成 最 适合 于 给 定 目标 机 
器 的 某 种 版 本 。 然 而 ， 这 需要 只 有 少数 编译 器 所 拥有 的 技术 组 合 。 对 于 dmxpy 的 情况 ， 程 序 员 重 写 代码 
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来 保证 最 终 代码 的 形态 将 使 编译 器 生成 高 效 的 目标 机 器 代码 。 


8.2.2 优化 的 各 种 考虑 


程序 员 运用 这 些 转换 在 于 他 们 相信 他 们 应 该 可 以 使 程序 运行 的 更 快 。 程 序 员 还 必须 相信 他 们 将 保留 
程序 的 意义 。( 毕竟， 如 果 转 换 不 需要 保持 意义 ， 那 么 为 什么 不 用 一 个 nop 取 代 整 个 过 程 呢 ? ) 

安全 性 和 有 效 性 这 两 个 问题 是 每 一 种 优化 的 核心 。 编 译 器 必须 有 一 种 证 明 转 换 的 每 一 次 应 用 都 是 安 
全 的 机 制 ， 即 它 保持 程序 的 意义 。 编 译 器 必须 有 理由 相信 转换 的 应 用 是 有 效 的 ;， 即 ， 它 改进 程序 的 性 能 。 
如 果 这 两 个 情况 不 都 是 真 的 ， 也 就 是 说 运用 这 一 转换 将 改变 程序 的 意义 或 将 使 得 程序 的 性 能 更 差 的 话 ， 
那么 编译 器 就 不 应 该 运用 这 一 转换 。 

1. 安全 性 

程序 员 是 如 何 知道 这 一 转换 是 安全 的 呢 ? 也 就 是 说 为 什么 程序 员 相 信 转 换 后 的 代码 产生 与 原 代 码 相 
同 的 结果 呢 ? 对 循环 嵌 套 的 仔细 检查 表明 连续 迭代 之 间 的 相互 作用 只 通过 y 的 成 员 出 现 。 


定义 安全 性 


正确 性 是 编译 器 必须 满足 的 最 重要 的 准则 ， 编 译 器 所 产生 的 代码 必须 与 输入 程序 有 相同 的 意义 。 
优化 器 每 次 运用 一 个 转换 时 ， 这 一 转换 动作 必须 保持 这 一 转换 的 正确 性 。 | 
2 (meaning) 一 般 定义 为 程序 的 可 观察 行为 。 对 于 一 个 批 处 理 程序 ， 当 它 停止 后 ， 可 观察 | 
行为 就 是 内 存 的 状态 以 及 这 一 程序 生成 的 输出 。 如 果 这 一 程序 终止 ， 那 么 在 这 一 程序 停止 之 前 的 瞬 | 
间 ， 所 有 可 视 变 量 的 值 应 该 在 任何 翻译 方案 下 都 是 相同 的 。 对 于 一 个 交互 式 程序 ， 这 一 可 视 行为 更 | 
复杂 并 更 难 刻画 。 





Plotkin 把 这 一 概念 形式 化 为 可 观察 等 价 (observational equivalence ) 。 


对 于 两 个 表达 式 M 和 N， 我 们 说 M 和 N 是 可 观察 等 价 的 ， 当 且 仅 当 在 任意 使 M 和 N 封 闭 
的 上 下 文 C 中 ，( 也 就 是 说 ， 没 有 自由 变量 )， 评 估 C[M] 和 C[N] 或 者 产生 相同 的 结果 ， 或 者 
都 不 终止 [275]。 


因此 ， 两 个 表达 式 可 观察 等 价 ， 如 果 它 们 对 于 可 视 的 外 部 环境 的 影响 是 相同 的 。 

在 实践 中 ， 编 译 器 使 用 的 等 价 概念 比 Plotkin 的 概念 简单 且 宽 松 ， 即 如 果 两 个 不 同 的 表达 式 e 和 e' | 
在 它们 实际 的 程序 上 下 文中 产生 相同 的 结果 ， 那 么 编译 器 就 可 以 用 e 取代 e。 | 

这 一 标准 比 Plotkin 的 标准 宽松 。 它 只 考虑 在 程序 中 实际 出 现 的 上 下 文 ; 使 代码 适合 上 下 文 是 许 
多 优化 机 会 的 源泉 。 这 一 标准 不 论 及 当 一 个 计算 出 现 错误 ， 或 发 散 时 发 生 的 事情 。 

在 实践 中 ， 编 译 器 留意 不 引起 发 散 的 情况 ， 即 源 代 码 能 够 正确 工作 ， 而 优化 代码 却 试图 作 除数 | 
为 零 的 除法 或 无 穷 循 环 的 情况 。 相反 的 情况 ， 即 源 代码 发 数 而 优化 代码 却 不 发 散 的 情况 。 | 








“计算 为 y(i) WEERA- KERTEH. AMARA, AAs aH 
好 定义 一 个 值 ， 而 且 没 有 其 他 迭代 引用 这 个 值 。 因 此 ， 和 迭代 可 以 以 任意 顺序 执行 。( 例如 ， 我 们 可 
以 反 转 内 循环 ， 从 n1 到 1 运行 它 ， 而 不 改变 结果 。) 

。 通 过 y 的 相互 作用 的 效应 受到 限制 。y 的 第 ;个 元 素 累加 内 循环 所 有 第 ;次 迭代 的 和 。 这 一 累加 的 模式 
可 以 在 展开 的 循环 中 安全 地 重新 生成 。 

优化 过 程 中 所 做 的 大 部 分 分 析 都 朝 着 证 明 转换 的 安全 性 方面 努力 。 
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2. 有 效 性 

为 什么 程序 员 可 以 认为 展开 循环 会 改进 性 能 呢 ? 也 就 是 说 ， 为 什么 这 一 转换 是 有 效 的 呢 ? 展开 循环 
的 几 种 不 同 效应 可 能 提高 代码 的 速度 。 

。 循环 迭代 总 数 减 小 到 了 十 六 分 之 一 。 从 而 减 小 循环 控制 带 来 的 额外 操作 : 加 法 、 比 较 、 跳 转 和 分 

支 。 如 果 循 环 执行 成 千 上 万 次 ， 那 么 这 些 节约 将 变 得 很 重要 。 

这 一 论点 上 暗示 更 大 因数 的 展开 。 有 限 资源 的 限制 也 许 要 求 我 们 选择 16。 例 如 ， 内 循环 对 所 有 内 特 
环 和 迭代 都 使 用 x 的 16 个 值 。 很 多 处 理 器 仅 有 32 个 可 以 保存 浮 点 数 的 寄存 器 。 用 2 的 下 一 个 宕 32 展 开 将 保 
证 x 的 这 些 “ 循 环 不 变量 ” 值 不 能 保存 在 寄存 器 中 。 这 将 把 内 存 操作 加 到 内 循环 ， 有 可 能 抵消 展开 带 来 
的 节省 。 

“数组 地 址 计算 包含 复制 工作 。 考 虚 y(1) 的 使 用 。 对 于 x 和 m 的 每 一 次 相 乘 ， 原 来 的 代码 计算 一 次 

yO) 的 地 址 ; 而 转换 后 的 代码 是 每 16 次 乘法 计算 一 次 这 一 地 址 。 展 开 代码 只 做 1/16 次 y(1) 的 寻 址 

工作 。 对 m 的 16 次 引用 和 对 x 的 更 少 引用 将 包含 循环 可 以 计算 一 次 并 复 用 的 公共 部 分 。 

“假设 x 值 留 在 寄存 器 内 ， 那 么 忽视 地 址 计算 ， 展 开 内 循环 对 于 17 次 装 入 和 1 次 存储 要 执行 16 次 

乘法 和 16 次 加 法 。 对 于 两 次 装 入 和 1 次 存储 原来 的 代码 执行 1 次 乘法 和 1 次 加 法 。 这 一 转换 后 的 

循环 似乎 不 可 能 达到 内 存 边界 。9 这 一 循环 有 充足 的 独立 算术 来 重 倒 操作 并 隐藏 菜 些 等 待 时 

间 。 . 

展开 对 其 他 机 器 相关 的 其 他 效应 也 有 帮助 。 它 增加 内 循环 中 代码 总 量 ; 这 可 能 使 指令 调度 器 更 好 地 
隐藏 等 待 时 间 。 如 果 循 环 末尾 分 支 有 较 长 的 等 待 时 间 ， 那 么 展开 可 以 使 编译 器 填充 那个 分 支 的 所 有 等 竺 
槽 。 在 某 些 处 理 器 上 ， 未 使 用 的 等 待 槽 必须 由 nop 填 充 。 在 这 种 情况 下 ， 展 开 可 以 减少 发 行 的 nop 总 数 
量 ; 从 而 减少 总 的 内 存 冲突 ， 而 且 有 可 能 减少 用 于 执行 这 一 程序 的 能 量 。 

3. 风险 

如 果 改 进 性 能 的 转换 使 得 编译 器 更 难 生成 好 的 程序 代码 ， 那 么 所 有 那些 潜在 的 问题 都 应 认为 是 有 效 
性 问题 。 在 dmxpy 上 执行 的 手工 转换 给 编译 器 带 来 如 下 新 挑战 : 


“对 寄存 器 的 要 求 : 原来 的 循环 只 需要 少量 的 寄存 器 来 保存 它 的 活动 值 。 只 有 x(j) 和 x、y 和 m 的 地 


址 计算 的 某 个 部 分 ， 以 及 循环 索引 变量 在 循环 迭代 过 程 中 需要 寄存 器 ， 而 y(1) 和 m (i, j) WE 
时 性 地 需要 寄存 器 。 相 反 ， 转 换 后 的 循环 在 循环 期 间 把 x 的 16 个 元 素 保 存在 寄存 器 中 ， 另 外 还 有 m 
和 y(1) 的 16 个 值 暂时 性 地 需要 寄存 器 。 l l 

。 地 址 计算 的 形式 : 原来 的 循环 处 理 对 应 于 y、xX 和 m 的 3 个 地 址 。 因 为 转换 后 的 循环 在 每 一 次 迭代 引 

用 更 多 的 不 同位 置 ， 所 以 编译 器 必须 小 心 塑造 地 址 计算 的 形式 以 避免 重复 计算 和 对 寄存 器 的 额外 
要 求 。 在 最 坏 的 情况 下 ， 代 码 可 能 对 x 的 所 有 16 个 元 素 、m 的 所 有 16 个 元 素 和 y 的 一 个 元 素 使 用 独立 
的 计算 。 

如 果 编 译 器 适宜 地 塑造 地 址 计算 形式 ， 它 可 以 对 m 和 x 各 使 用 一 个 指针 ， 每 个 指针 带 有 16 个 常量 值 偏 
移 量 。 它 可 以 重 写 循环 以 把 这 一 指针 用 于 尾 端 循环 测试 ， 回 避 对 另 一 个 寄存 器 的 需要 ， 并 消除 另 一 次 更 
新 。 计 划 和 优化 在 这 两 种 情况 下 产生 差异 。 l 

还 存在 与 机 器 相关 的 其 他 问题 。 例 如 ， 在 每 次 迭代 中 ， 需 要 小 心地 调度 17 次 装 入 、! 次 存储 、16 次 
乘法 、16 次 加 法 再 加 上 地 址 计算 以 及 循环 负荷 的 操作 。 编 译 器 可 能 需要 在 前 一 次 迭代 发 行 其 中 的 若干 装 


O 为 了 确定 这 一 循环 是 否 实际 达到 内 存 边界 需要 有 关 目 标 处 理 器 的 更 加 详细 的 知识 ， 其 中 包括 各 操作 的 等 待 
时 间 以 及 它 在 一 个 循环 能 够 发 行 的 操作 种 类 和 数量 。 
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入 操作 ， 使 得 它 能 够 适时 地 调度 初始 浮 点 操作 。 


8.2.3 优化 的 机 会 


正如 我 们 所 看 到 的 那样 ， 简 单 循环 的 优化 任务 就 可 能 包含 很 多 复杂 的 考虑 事项 。 优 化 编译 器 一 般 利 
用 来 自 于 不 同 源头 的 机 会 : 

1. 减 小 抽象 的 负荷 

正如 在 本 章 一 开始 我 们 所 看 到 的 数组 地 址 计算 那样 ， 程 序 设计 语言 所 引入 的 数据 结构 和 类 型 需要 运 
行 时 支持 。 优 化 器 使 用 分 析 和 转换 来 减 小 这 种 负荷 。 

2. 利用 特殊 情况 

通常 ， 编 译 器 可 以 使 用 操作 执行 的 上 下 文 信息 来 特 化 该 操作 。 作 为 例子 ，C++ 编 译 器 有 了 时 可 以 确定 
对 于 一 个 有 虚 函 数 的 调用 总 使 用 相同 的 实现 。 在 这 种 情况 下 ， 它 可 以 重新 映射 这 一 调用 并 减少 每 次 调用 的 
代价 。 

3. 匹配 处 理 器 资源 

如 果 一 个 程序 的 资源 需求 不 同 于 处 理 器 所 提供 的 资源 ， 那 么 编译 器 可 以 转换 这 一 程序 使 它 的 需求 
与 处 理 器 的 能 力 更 接近 。 运 用 于 dmxpy 的 转换 就 有 这 种 效应 ;它们 减少 对 于 每 一 个 浮 点 操作 的 内 存 存 取 
数量 。 

总 而 言 之 ， 这 些 问 题 涉及 的 范围 很 广 。 当 我 们 在 第 9 章 和 第 10 章 中 讨论 特定 分 析 和 转换 技术 时 ， 将 
使 用 更 详细 的 例子 来 讨论 这 些 领 域 的 问题 。 


8.3 元 余 表 达 式 


作为 一 个 具体 的 例子 ， 考 虑 寻找 并 消除 基本 块 内 部 的 宛 余 表 达 式 问 题 。 一 个 基本 块 是 直线 式 无 谓 
词 代码 的 最 长 片段 。 为 了 使 问题 简单 化 ， 我 们 的 算法 将 忽视 在 基本 块 前 后 发 生 的 任何 事情 。 一 个 表达 
式 x+y 在 一 个 块 里 是 元 余 的 ， 如 果 它 在 这 一 块 里 已 被 计算 过 ， 而 且 没 有 再 定义 x 或 y 的 中 间 操 作 。 如 果 编 
译 器 发 现 一 个 元 余 表 达 式 ， 那 么 它 可 以 保存 第 一 次 计算 时 的 那个 值 ， 并 用 对 那个 值 的 引用 取代 后 来 的 
评估 。 

我 们 可 以 在 源 代码 级 别 上 处 理 这 一 问题 ， 如 图 8-2 所 示 。 图 8-2a 中 的 源 代码 两 次 计算 2 x y。 图 8-2b 中 
的 代码 给 出 它 的 重 写 代 码 以 避免 复制 操作 。 这 一 重 写 代码 有 更 多 语句 ， 但 有 较 少 的 操作 。 当 编译 器 把 它 
翻译 成 目标 代码 时 ， 较 低 的 操作 计数 一 般 将 产生 较 快 的 代码 。 程 序 员 可 以 避免 自己 去 编写 包含 这 样 的 宛 
余 表 达 式 的 代码 。 而 预 处 理 器 及 生成 源 代码 的 其 他 工具 则 比 程 序 员 更 有 可 能 创建 这 些 元 余 代 码 。 这 样 的 
表达 式 还 可 能 大 量 出 现在 如 把 源 代码 翻译 成 较 低 级 IR 期 间 所 做 的 地 址 计算 等 计算 中 。 编 译 器 也 可 以 把 元 
余 消 除 技术 用 于 低级 IR 上 。 


to 全 2 xy 


me2xyxz me ty xz 


ne3xyxz ne3xyxz 


o2 xy-z oH tp -2z 


a) 源 代 码 b) 重 写 代码 





图 8-2 源 代码 级 元 余 表 达 式 
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为 了 自动 发 现 并 消除 元 余 ， 编 译 器 需要 寻找 元 余 的 算法 以 及 重 写 无 元 余 代码 的 算法 。 我 们 将 给 出 解 
决 这 一 问题 的 两 个 不 同方 法 : 构建 DAG 和 计算 值 编号 。 393 


8.3.1 构建 有 向 无 环 图 
明确 地 表示 宛 余 计算 的 一 个 方法 就 是 使 用 有 向 无 环 图 (directed acyclic graph，DAG)。 在 AST 中 ， 
每 个 结 点 至 多 有 一 个 父 结 点 。 因 此 ， 图 8-2a 中 的 示例 代码 的 AST 形 式 如 下 : 


StmtList 


K LI 
下 下、 LA 人 
YS ZNAN 
LN OO 
oN, 


相反 ，DAG 仅 一 次 表示 每 个 不 同 的 表达 式 。 在 DAG 中 ， 一 个 结 点 可 能 有 多 个 父 结 点 。 每 一 个 父 结 
点 表示 对 这 一 结 点 表示 的 值 有 一 个 引用 ; 带 有 多 个 父 结 点 的 任意 结 点 一 定 是 元 余 表 达 式 。 由 前 面 AST 构 
建 的 DAG 如 下 所 示 : 


StmtList 


nti 
iN 
m x 全 StmtList 
Nw, Z/N 
ENN 
“oN N 


人 ~ 
2 y 


这 一 DAG 揭 示 出 这 样 的 事实 : 子 表达 式 2 x y 在 源 代码 中 出 现 两 次 。 表 示 2 x y 的 结 点 有 两 个 父 结 点 : 第 一 1394 
个 赋值 中 的 乘法 和 第 三 个 赋值 中 的 减法 。 编 译 器 可 以 生成 利用 这 一 事实 的 代码 (与 图 8-2b 类 似 )。 把 
DAG 用 作 元 余 消 除 工具 的 关键 是 系统 、 高 效 地 定位 这 些 相同 的 表达 式 。 

实现 这 一 用 标的 最 简单 方法 是 修改 编译 器 构造 AST 的 例 程 。 如 果 构 造 器 使 用 散 列 来 发 现 相 同 子 
树 ， 那 么 它 将 构建 每 个 不 同 表 达 式 有 一 棵 子 树 的 DAG。 这 将 产生 理想 的 2 x y 共 享 。 它 还 将 发 现 y 的 所 
有 实例 有 相同 值 ， 而 且 z 的 所 有 实例 也 有 相同 值 。 因 此 ， 实 际 的 DAG 将 比 前 面 的 DAG 更 复杂 ， 如 下 
图 所 示 。 
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二 StmtList 
JN 
m x — StmtList 
NO ZN Z/N 





YN 
2 y 


这 一 DAG 使 用 更 少 的 结 点 来 表示 相同 的 三 个 语句 。 分 析 树 有 24 个 结 点 ， 第 一 个 DAG 有 21 个 结 点 ， 
而 最 后 的 DAG 有 18 个 结 点 。( 如 果 目 标 是 缩小 AST， 那 么 这 个 思想 发 挥 作用 。) 

在 这 种 情况 下 ，2 x y 的 两 个 实例 有 相同 的 值 。 然 而 ， 这 是 一 种 偶然 而 非 精心 设计 的 。 基 于 散 列 的 构 
造 器 对 于 相等 使 用 文本 概念 ， 所 以 y 等 于 y， 与 值 无 关 。 构 造 器 保证 两 个 操作 共享 一 个 表示 ， 如 果 它 们 有 
相同 的 操作 符 且 它们 的 操作 数 有 相同 的 表示 。 考 虑 如 果 我 们 把 第 二 个 赋值 的 左 部 从 n 改 成 y， 那 么 将 会 发 
生 什么 呢 ? 用 于 把 y 与 y 匹 配 的 文本 机 制 无 法 确定 一 个 中 间 赋 值 是 否 改变 了 y 的 值 。 因 此 ， 修 改 后 的 例子 
的 DAG 仍 然 共 享 2 x y 的 表示 ， 即 使 两 次 出 现 可 能 有 不 同 的 值 。 如 果 我 们 的 目标 是 识别 一 定 计算 相同 值 的 
子 表达 式 ， 那 么 我 们 需要 考虑 赋值 影响 机 制 。 

为 了 使 基于 散 列 的 DAG 构 造 器 反映 赋值 ， 我 们 可 以 跟踪 每 个 变量 的 不 同 版 本 。 这 一 机 制 很 简单 :把 
一 个 计数 器 与 每 个 变量 相关 联 ， 并 在 每 个 赋值 处 增加 被 重新 定义 变量 的 计数 器 。 在 基于 散 列 的 构造 器 中 ， 
在 散 列 之 前 给 每 一 个 变量 名 附加 一 个 计数 器 。 通 过 这 些 修改 ， 基 于 散 列 的 构造 器 将 构建 一 个 DAG， 在 这 
个 DAG 中 两 个 表达 式 有 相同 的 表示 当 且 仅 当 这 两 个 表达 式 在 文本 上 相同 且 用 于 这 一 表达 式 中 任意 变量 在 
这 一 表达 式 的 两 次 出 现 之 间 都 不 被 重新 定义 。( 我 们 使 用 5.5 节 和 9.3 节 中 描述 的 一 种 IR， 即 SSA 来 形式 化 
这 一 计数 器 方案 。) 

指针 赋值 

给 y 赋 一 个 新 值 的 效应 有 限 ， 所 以 下 标 方案 能 很 好 地 进行 模型 化 。 指 针 赋值 则 有 更 加 广泛 的 效应 。 
诸如 C 语 言 中 的 *p=0 这 样 的 赋值 必须 递增 它 可 能 修改 的 每 一 个 变量 的 下 标 。 如 果 编译 器 对 指针 的 值 有 详 
细 的 信息 ， 那 么 它 可 能 限制 这 一 效应 并 递增 一 小 组 下 标 。 然 而 ， 如 果 编 译 器 对 p 指 向 何 处 知之 其 少 ， 那 
么 它 必须 递增 指针 赋值 可 能 修改 的 每 一 个 变量 的 下 标 ， 这 有 可 能 是 整个 程序 中 的 每 一 个 变量 的 下 标 。 

这 似乎 有 些 极端 ， 但 是 这 却 反映 了 编译 器 能 够 得 到 的 于 义 性 指针 操作 对 事实 集合 的 实际 影响 。 如 果 
源 语言 允许 任意 的 指针 算术 ， 那 么 这 就 涉及 存储 在 内 存 中 的 每 一 个 变量 。 不 允许 任意 的 指针 算术 ， 编 译 
器 可 能 把 影响 限定 于 指针 能 够 达到 的 那些 变量 上 ， 有 时 这 可 以 用 这 样 的 变量 集合 来 近似 ， 该 集合 中 的 变 
量 的 地 址 在 程序 中 被 使 用 。 执 行 指针 分 析 的 一 个 主要 动机 是 缩小 这 些 集合 的 大 小 。 

在 对 代码 使 用 树 型 表示 的 编译 器 中 ， 把 DAG 构 建 机 制 直接 做 入 树 构造 器 中 具有 优势 。 这 产生 更 小 的 
蔗 程 序 ， 以 及 伴随 而 来 的 对 编译 的 好 处 。 它 使 元 余 被 显 式 地 表示 出 来 : 带 有 多 个 父 结 点 的 任意 操作 一 定 
是 完 余 的 。 最 后 ， 它 保证 这 一 思想 得 到 彻底 的 应 用 。 当 编译 器 的 其 余部 分 处 理 耻 时 ， 例 如 把 2 x x x y 重 
写作 Xx x ytx x y 时 ， 这 一 散 列 构造 器 将 保证 结果 信 直 接 反 映 共 用 子 表达 式 。 


U 
Re] 
A 
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| 顺序 的 重要 性 


表达 式 的 特定 书写 顺序 对 优化 算法 分 析 及 转换 这 些 表达 式 的 能 力 有 直接 的 影响 。 考 虑 用 于 说 明 | 
| DAG 构 造 法 的 赋值 序列 。 


m- 2xyxz 
n e 3xyxz 
0 2xy-z 


基于 散 列 的 DAG 构 造 算法 发 现 2 x y 在 第 一 和 第 三 个 赋值 中 重复 出 现 。 它 没有 注意 到 y x z 分 别 在 
第 一 和 第 二 个 赋值 中 出 现 两 次 。 按 左 结合 处 理 乘法 隐藏 了 y x z 的 重复 使 用 。 按 右 结合 处 理 乘法 揭示 | 
出 yx z， 但 是 隐藏 2 x y。 | 
| 使 用 交换 律 、 结 合 律 和 分 配 律 对 表达 式 重 新 排序 可 以 改变 优化 的 结果 。 例 如， 考虑 表达 式 3 x ax5。| 

使 用 二 元 x 的 任意 表示 只 有 两 种 可 能 的 组 合 方式 : 

(3xa)x5 和 

3x(ax5)。 

无 论 哪 种 顺序 都 无 法 把 两 个 常量 组 合 到 一 起 。 因 此 ， 编 译 器 在 运行 时 评估 的 表达 式 3 x 5 从 不 在 
| 考虑 之 列 。 | 
因为 存在 很 多 重 排序 较 大 表达 式 的 方法 ， 所 以 编译 器 使 用 启发 式 技术 来 搜索 更 好 的 表达 式 排 序 。 | 
| 例如 ，IBM FORTRAN H 编 译 器 生成 它 的 所 有 数组 地 址 计算 ， 因 为 这 可 能 用 于 改进 其 他 优化 。 其 他 

编译 器 对 可 交换 操作 的 操作 数 排序 ， 这 一 顺序 对 应 于 这 些 操作 数 被 定义 的 循环 幅 套 层次 。 因 为 存在 
| 如 此 多 的 解决 方案 ， 所 以 编译 器 设计 者 必须 尝试 不 同 的 想法 以 便 确定 对 于 特定 的 语言 、 编 译 器 和 编 
| 码 风格 什么 是 合适 的 。 





8.3.2 值 编号 


把 元 余 编 码 到 树 结 点 的 概念 不 适用 于 使 用 线性 IR 的 编译 器 。 对 于 线性 IR， 编 译 器 设计 者 可 能 需要 分 
析 线 性 IR 并 重 写 民 以 消除 元 余 的 技术 。 实 现 这 一 目标 的 经 典 技术 称 为 值 编 号 (value numbering), AAR 
很 简单 。 算 法 为 运行 时 计算 的 每 个 值 指定 一 个 不 同 的 数 ， 使 其 具有 这 样 的 性 质 : 两 个 表达 式 e; 和 ey 有 相同 
的 值 编 号 当 且 仅 当 e 和 e 对 于 这 两 个 表达 式 的 所 有 可 能 的 操作 数 都 肯定 相等 。 

值 编号 依赖 于 对 DAG 构 造 法 的 相同 观察 : 编译 器 可 以 使 用 散 列表 来 识别 产生 相同 值 的 表达 式 。“ 元 
余 ” 的 操作 定义 稍 许 不 同 ， 如 果 它 们 有 相同 的 操作 符 且 它们 的 操作 数 有 相同 的 值 编号 ， 则 两 个 表达 式 被 
认为 是 元 余 的 。 为 了 把 变量 、 常 量 和 已 计算 的 值 映射 到 它们 的 值 编号 上 ， 编 译 器 使 用 一 个 散 列表 。 对 于 
一 个 变量 或 常量 ， 编 译 器 可 以 把 它 的 扫描 文本 用 作 它 的 散 列 关键 字 。 对 于 一 个 包含 操作 符 的 表达 式 ， 编 
译 器 可 以 从 这 个 操作 符 和 它 的 操作 数 的 值 编号 构建 散 列 关键 字 ; 相同 的 散 列 关 键 字 必定 产生 相同 的 运行 
时 值 。 i 

当 计算 新 值 时 ， 这 些 值 得 到 新 的 值 编号 。 因 为 散 列 关 键 字 使 用 操作 数 的 值 编号 ， 而 不 是 它们 的 名 字 ， 
所 以 这 一 算法 以 一 种 自然 的 方式 处 理 非 歧义 性 赋值 。 在 序列 中 ， 

xeatd 
yea 


zeydtd 





w 
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y 得 到 与 a 相同 的 值 编号 ， 所 以 y+d 得 到 与 atd 相 同 的 值 编 号 。 涉 及 指针 或 数组 元 素 等 的 歧义 性 赋值 仍然 有 
着 灾难 性 的 效应 ， 因 此 必须 废除 指针 可 能 达到 的 所 有 变量 的 值 编号 。 

图 8-3 给 出 基本 的 值 编号 算法 ， 它 假设 以 形式 为 resu1te 一 operandi op。operand, 的 表达 式 为 输入 。 
这 一 算法 开始 于 一 个 空 的 值 表 。 为 了 得 到 一 个 操作 数 的 值 编号 ， 算 法 在 这 一 值 表 中 查找 这 一 操作 数 。 如 
果 存 在 一 个 条 目 ， 算 法 就 使 用 已 指定 给 这 一 条 目的 值 编号 。 如 果 不 存 在 这 一 条 目 ， 那 么 算法 创建 一 个 条 
目 并 给 这 个 条 目 指定 一 个 新 的 值 编 号 。 一 旦 它 有 了 所 有 操作 数 的 值 编 号 ， 算 法 为 上 述 整 个 表达 式 构 造 散 
列 关键 字 ， 并 使 用 这 个 关键 字 在 表 中 查找 这 一 表达 式 。 如 果 存 在 一 个 条 目 ， 那 么 这 一 表达 式 e 是 元 余 的 。 
如 果 不 存 在 这 样 的 条 和 目 ， 那 么 这 一 表达 式 不 是 元 余 的 ， 因 此 算法 使 用 表达 式 的 新 值 编号 在 值 表 中 登记 这 
一 表达 式 。 它 还 在 resu1t。 的 条 上 自 中 记录 这 一 值 编号 ，resu1t。 是 由 这 一 表达 式 定义 的 名 字 。 把 这 一 算法 
扩展 到 任意 元 的 表达 式 是 直截了当 的 。 


for each expression e in the block of the form 
result. +- operand; Ope operand. 


. get the value numbers for operand; and operand2 


. construct a hash key from the operator and 
the value numbers for operand; and operandz 


. if the hash key is already present in the table then 
replace expression e with a copy operation and 
record the value number for resulte 

else ` 
insert the hash key into the table 
assign the hash key a new value number and 
record that value number for resulte 





图 8-3 值 编 号 化 一 个 块 
为 了 和 弄 明白 这 一 算法 是 如 何 工 作 的 ， 考 虑 下 面 的 例子 。 列 a 给 出 值 编号 化 之 前 的 一 个 短 基 本 块 。 
at 人 b+ 人 C a? e bl + c? aebte 
bea-d bs « a — dé bea-d 
ce bte cê + b? + c? ceb+c 
dea-d d e a3 - dé deb 


a) 源 代码 b) 值 编号 代码 c) 重 写 代码 


列 b 给 出 这 一 算法 指定 给 每 个 名 字 的 值 编号 。 最 初 ， 对 于 空 值 表 , b 和 c 得 到 新 的 值 编号 。 使 用 b 的 值 编号 
( 即 1) 和 c 的 值 编号 〈 即 2) 以 及 操作 符 “+”， 值 编号 算法 给 第 一 个 表达 式 创建 一 个 文本 串 “1+2”， 并 将 
其 用 作 散 列 关键 字 ， 或 某 个 散 列 函数 的 输入 。 把 这 个 散 列 函 数 的 输出 作为 索引 ， 值 编号 算法 在 这 个 值 表 
中 寻找 这 个 散 列 关键 字 。 寻 找 失败 ， 因 此 算法 为 这 一 散 列 关 键 字 创 建 一 个 条 目 ， 并 给 它 指定 值 编 号 3 。 
为 了 保证 对 a 的 后 继 引 用 发 现 它 的 正确 值 编号 ， 算 法 还 为 a 创 建 一 个 条 目 并 给 它 指 定 值 编 号 3。 对 每 个 操 
作 依 次 重复 这 一 过 程 产生 上 图 中 上 标 所 示 的 值 编号 。 o 

值 编号 正确 地 展示 由 于 中 间 的 b 的 再 定义 b+c 的 两 次 出 现 产生 不 同 值 。 另 一 方面 ，a-d 的 两 次 出 现 产 
生 相 同 的 值 ， 因 为 它们 有 相同 的 输入 值 编号 和 相同 的 操作 符 。 这 一 算法 发 现 这 一 事实 并 通过 对 b 和 d 指 


` 定 相同 的 值 编号 5 来 记录 这 一 事实 。 利 用 这 样 的 事实 ， 编 译 器 可 以 如 列 c 所 示 那 样 重 写 代码 。 编 译 器 的 


后 继 遍 可 能 消除 拷贝 dc-b。( 我 们 可 以 给 值 编 号 算法 增加 一 个 机 制 ， 使 用 b 取 代 对 d 的 后 继 引 用 。 这 将 不 
再 需要 找 贝 操作 。 作 为 软件 工程 的 一 个 核心 问题 ， 我 们 愿意 插入 一 个 拷贝 并 假设 后 来 的 编译 器 遍 将 消 
RE.) 
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1. 扩展 值 编号 算法 

值 编号 算法 是 执行 其 他 若干 局 部 优化 的 自然 场所 。 因 操作 数 的 顺序 的 不 同 而 不 同 的 可 交换 操作 应 该 
得 到 相同 的 值 编号 。 为 了 处 理 这 一 工作 ,编译 器 可 以 使 用 适当 的 方案 对 每 个 可 交换 操作 符 的 操作 数 排序 ， 
例如 用 值 编号 排序 这 些 操作 数 。 同 样 地 ,如 果 算 法 知道 某 个 操作 的 所 有 操作 数 是 常量 且 算法 有 它们 的 值 ， 
那么 它 可 以 在 编译 时 执行 这 一 操作 并 把 答案 直接 又 入 代码 中 。 为 了 处 理 这 一 工作 ， 编 译 器 设计 者 需要 在 
值 表 中 加 入 标明 常量 值 的 表 记 法 。 当 编译 器 发 现 一 个 常量 值 表 达 式 时 ， 它 就 会 评估 这 一 操作 ， 给 其 结果 
指定 一 个 值 编号 ， 并 用 它 来 取代 对 该 常量 值 的 任意 后 继 引 用 。 

我 们 还 可 以 扩展 值 编号 算法 来 发 现 不 产生 影响 的 操作 ， 算 法 运用 基 些 代数 等 式 。 例 如 ，x+0 应 该 与 x 
得 到 相同 的 值 编号 。 为 了 处 理 代 数 等 式 ， 这 一 算法 需要 特殊 情况 代码 来 发 现 每 一 个 等 式 。 对 应 一 个 等 式 
的 一 系列 测试 很 容易 变 得 太 长 ， 从 而 使 值 编号 过 程 的 速度 慢 得 令 人 无 法 接受 。 取 而 代 之 的 是 ， 应 该 把 这 
些 宰 试 组 织 成 以 操作 符 为 第 一 个 测试 开关 的 一 棵 树 ， 这 可 以 保证 检查 等 式 的 负荷 较 小 。 下 面 的 表 给 出 用 
这 种 方法 可 以 处 理 的 一 些 等 式 。 


值 编号 的 代数 等 式 
a+0=a a-0=a a-a=0 2xa=a+aā 
axl=a ax0=0 a+l=a a+a=l1,a 0 
al =a 2 =axa a>0=a ac0=a 


a AND a@=a a OR a=a MAX(a,a) =a MIN(a,a) =a 


一 个 聪明 的 实现 器 会 发 现 其 他 等 式 ， 其 中 包括 某 些 特定 类 型 的 等 式 。 计 算 带 有 相同 值 编号 的 两 个 值 
的 异 或 将 产生 适当 类 型 的 零 。 还 有 ， 在 IEEE 浮 点 格式 中 的 数 具有 某 些 由 % 和 NaN ( 非 数 字 ) 的 显 式 表示 
引入 的 特殊 情况 ; 例如 % 一 =NaN，o - NaN= NaN 和 co + NaN=NaN. 

图 8-4 给 出 带 有 这 些 扩展 的 算法 。 步 最 2 评估 并 和 登入 常量 值 操 作 。 步 景 3 检 查 因 实现 代数 等 式 而 可 以 
消除 的 操作 。 步 又 4 对 可 交换 操作 的 操作 数 重新 排序 。 步 又 1、5 和 6 是 从 原来 的 程序 延续 过 来 的 。 即 使 使 
用 这 些 扩展 ， 对 每 个 IR 操 作 的 代价 仍然 维持 在 较 低 的 水 平 。 每 一 步骤 都 有 高 效 的 实现 。 l 


for each operation e in the block of the form 
resulte +- operand, ope operanda 


. get the value numbers for operand, and operandz 
, if all the operands to ope are constant 
evaluate it and replace later uses with references 
. if the operation is an identity 
replace it with a copy operation 
. if Ope is commutative 
sort the operands by their value numbers 


. construct a hash key from the operator and 
the value numbers for operand, and operand 
. if the hash key is already present in the table then 
replace operation e with a copy operation and 
record the value number found for resulte 
else 
insert the hash key into the table 
assign the hash‘key a new value number and 
record that value number for result, 





图 8-4 扩展 值 编号 
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2. 命名 的 角色 
变量 和 值 的 名 字 的 选择 可 能 会 限制 值 编号 的 效果 。 考 虑 当 上 述 算法 用 于 下 面 的 短 块 时 所 发 生 的 情况 : 
atcxty aa 人 x) + y? aexty 
be-xty b « x} + y? bza 
ael at + 174 a 一 17 
cexty Sexty cexty 


源 代 码 值 编号 代码 重 写 代码 


这 一 算法 处 理 第 一 个 运算 并 给 它 指定 值 编号 3。 当 算法 过 到 第 二 个 操作 时 ， 它 发 现 对 于 (来自 于 x+y 的 ) 
散 列 关键 字 “1+2” 已 存在 一 个 表 条 目 ， 所 以 它 为 b 创 建 一 个 条 目 ， 并 为 它 指定 已 赋 的 关键 字 3。 这 一 操 
作 被 ba 取代 。 . 

接 下 来 ， 算 法 处 理 第 三 个 操作 。 为 常量 17 和 a 都 指定 值 编号 4。 最 后 ， 算 法 处 理 最 后 一 个 操作 。 它 发 
现 这 一 表达 式 是 元 余 的 ， 并 带 有 值 编号 3。 然 而 ， 这 个 值 在 a 中 的 已 记录 实例 不 再 存在 ， 因 为 第 三 个 操作 
已 经 复写 了 它 。 这 一 算法 不 能 消除 x+y 的 实例 ， 因 为 它 已 经 无 法 跟踪 这 个 值 的 驻 留 地 。 

我 们 可 以 用 两 个 不 同 的 方法 处 理 这 一 问题 。 算 法 可 以 构建 并 维护 从 值 编 号 到 名 字 的 映射 。 每 一 个 赋 
值 必须 更 新 这 一 映射 。 另外， 编译 器 也 可 以 按 给 每 一 个 赋值 制定 不 同名 字 的 方式 重 写 代码 。 为 了 满足 惟 
一 性 ， 只 要 给 每 一 个 名 字 加 上 一 个 下 标 就 可 以 了 。( 如 同 DAG 构 造 法 中 赋值 的 版 本 号 一 样 ， 这 一 方案 类 
似 于 SSA 形 式 的 一 个 性 质 。) 在 这 一 新 的 命名 规则 下 ， 上 例 的 块 变 成 : 

ao 全 Xo + Yo 

bo + Xo + Yo 

al + 17 

Co + Xo + Yo 


使 用 这 些 新 名 字 ， 代 码 对 每 个 值 刚 好 定义 一 次 。 因 此 ， 设 有 值 被 再 定义 或 失去 定义 ， 或 杀 死 (kiled). 
当 我 们 把 这 一 算法 运用 到 这 个 块 上 时 ， 它 产生 理想 的 结果 。 操 作 2 和 操作 4 被 证 明 是 元 余 的 ; 每 一 个 都 可 
以 用 从 ao 的 拷贝 操作 取代 。 然 而 ， 这 一 新 的 命名 方案 使 我 们 可 以 做 得 更 好 。 因 为 每 一 个 值 编号 有 惟一 的 
名 字 ， 我 们 可 以 省 赂 拷贝 操作 bo<-ao 和 co<—ao。 

优化 中 的 这 一 改进 也 有 相应 的 代价 。 在 我 们 能 够 执行 这 一 代码 之 前 ， 我 们 必须 与 程序 的 旧 意 义 协调 
这 一 新 名 字 空 间 。 特 别 地 ， 编 译 器 可 能 需要 插入 某 些 操 作 ， 以 便 在 控制 流 路 径 合并 点 处 协调 名 字 。 如 果 
有 两 个 路 径 进入 一 个 块 ，a 的 沿 着 一 条 路 径 的 最 新 定义 是 a13 而 沿 着 另外 一 条 路 径 是 a1;， 那 么 编译 器 也 许 
需要 创建 一 个 新 名 字 ， 例 如 az， 来 表示 al 和 al 的 合并 ， 并 在 一 个 前 驱 块 的 末尾 插入 拷贝 操作 az 一 at7， 
在 另 一 个 前 驱 块 的 末尾 插 和 人 拷贝 操作 az< as。 我 们 将 在 9.3 节 中 看 到 执行 这 种 拷贝 插入 的 算法 。 


8.3.3 元 余 消除 的 经 验 


DAG 构 造 法 和 值 编号 都 分 享 代码 改进 的 大 多 数 基于 编译 器 的 技术 的 典型 特性 。 这 两 个 方法 都 必须 阐 
明 两 个 问题 。 

1. 发 现 机 会 

- 这 两 个 技术 中 的 第 一 步 都 是 要 检查 块 中 的 每 一 个 表达 式 ， 并 确定 是 否 已 查 到 一 个 等 价 的 表达 式 。 
DAG 构 造 法 为 每 个 由 操作 符 (+, < SS) 和 它 的 操作 数 的 名 字 组 成 的 每 一 个 操作 创建 一 个 抽象 名 字 。 
它 使 用 这 一 抽象 名 字 为 进入 散 列表 的 关键 字 。 如 果 已 经 存在 这 一 抽象 名 字 的 一 个 条 目 ， 那 么 这 一 表达 式 
是 元 余 的 。 值 编号 使 用 类 似 的 机 制 ， 但 是 在 很 大 程度 上 又 不 相同 。DAG 构 造 法 认为 具有 相同 名 字 ， 即 相 
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同 拼写 的 操作 数 是 相同 的 。 值 编号 算法 认为 具有 相同 值 编号 的 操作 数 是 相同 的 。 这 使 得 它 通过 一 个 拷贝 
操作 来 跟踪 一 个 值 ， 如 在 序列 x<-atd、y<-a 和 z<y+d 中 那样 。 基 于 散 列 、 使 用 词法 相等 概念 的 构造 器 无 
法 发 现 atd 和 y+d 一 定 计算 相同 的 值 。 

2. 转换 代码 

一 旦 编译 器 证 明 一 个 表达 式 是 元 余 的 ， 它 必须 修改 式 以 便利 用 这 一 事实 。 在 DAG 构 造 法 中 ， 编 译 器 
直接 把 这 一 事实 编码 在 DAG 的 结构 中 。 因 为 目标 就 是 保证 元 余 表 达 式 的 每 个 实例 有 一 个 结 点 ， 通 过 记录 
适当 的 结 点 名 ， 编 译 器 在 散 列表 中 记录 这 一 元 余 。 当 后 继 操作 引用 这 一 操作 时 ， 它 将 找到 这 一 实例 。 值 
编号 通过 重 写 操作 来 进行 操作 。 当 它 发 现 元 余 操 作 时 ， 它 用 一 个 拷贝 操作 取代 这 一 操作 。 

这 种 两 部 结构 出 现在 很 多 优化 中 。 这 些 技术 有 通过 分 析 代 码 来 寻找 可 以 安全 运用 转换 的 机 会 的 部 分 ， 
以 及 通过 修改 IR 执 行 这 一 转换 的 部 分 。 下 一 节 给 出 分 析 和 转换 讨论 的 背景 。8.5 节 采用 值 编号 技术 并 把 
它 扩 展 到 比 基 本 块 更 大 的 区 域 上 的 操作 。8.6 节 探讨 完整 过 程 上 的 元 余 消 除 。 这 里 不 再 扩展 值 编号 ,我 
们 将 使 用 一 个 计算 可 用 表达 式 (available expression) 的 算法 ， 并 使 用 其 结果 来 重 写 代码 ， 可 用 表达 式 
是 数据 流 分 析 中 的 一 个 典型 问题 。 这 一 方法 发 现 与 值 编号 不 同 的 改进 。 


8.4 优化 作用 域 


前 面 一 节 描 述 的 两 个 技术 都 操作 于 基本 块 上 。 正 如 我 们 所 看 到 的 那样 ， 这 两 个 技术 收集 有 关 语 名 前 
面 的 上 下 文 信息 并 利用 这 一 信息 试图 改进 程序 。 很 多 优化 通过 得 到 上 下 文 知 识 并 利用 这 一 知识 改进 或 特 
化 代码 。 因 此 ， 一 个 技术 所 考虑 的 上 下 文 总 量 在 描述 、 实 现 和 理解 该 技术 中 起 着 重要 的 作用 。 分 析 和 转 
换 一 般 都 属于 下 面 五 个 范畴 ， 或 作用 域 中 的 一 个 : 局 部 、 超 局 部 、 区 域 、 全 局 及 整个 程序 。 


8.4.1 局 部 方法 


这 些 方 法 把 它们 的 注意 力 限制 在 基本 块 上 。 局 部 方法 通常 是 最 简单 的 分 析 和 理解 方法 。 图 8-5 给 出 
包含 七 个 基本 块 A、B、C、D、E、F 和 G 的 代码 片段 。 每 一 个 基本 块 都 结束 于 一 个 跳 转 或 分 支 。 

在 一 个 基本 块 内 部 有 两 个 重要 的 特性 。 第 一 ， 按 顺序 执行 语句 。 第 二 ， 如 果 任 意 语句 被 执行 ， 则 整 
个 基本 块 被 执行 。9 这 两 个 性 质 使 编译 器 能 够 使 用 相对 简单 的 分 析 证 明 比 更 大 作用 域 所 能 证 明 的 更 强 的 
事实 。 因 此 ， 局 部 方法 有 时 可 以 产生 更 大 作用 域 不 能 轻易 得 到 的 改进 。 然 而 ， 局 部 方法 被 局 限于 改进 出 
现在 相同 块 中 的 操作 。 


8.4.2 超 局 部 方法 


超 局 部 方法 操作 于 扩展 的 基本 块 上 (EBB)。 一 个 EBB p 是 一 组 块 B,，p,，…，p,， 其 中 p 可 能 有 多 
个 前 驱 ， 而 其 他 B，2 < i<n 在 EBB 中 有 惟一 前 驱 。 这 些 块 BEB 形 成 一 棵 只 能 从 它 的 根 B 进 入 的 树 。p 可 
以 有 多 个 出 口 ， 这 些 出 口 是 不 以 p 中 的 块 为 且 标 的 某 个 6 尾部 的 分 支 或 跳 转 。 

图 8-5 中 的 例子 有 三 个 极 大 EBB: {A, B, C, D, 如，{F} 和 {G}。 第 一 个 EBB 包 含 三 条 不 同 的 路 径 ， 
{4，B}、{4，C，D} 和 {4，C，E}。 后 两 个 EBB 是 由 一 个 块 组 成 的 平凡 EBB。 然 而 ,因为 F 和 G 都 有 多 
个 前 驱 ， 所 以 它们 不 能 包含 在 它们 的 前 驱 EBB 中 。 


O 运行 时 异常 可 以 中 断 一 个 块 的 执行 。 典 型 地 ， 异 常 促 使 到 异常 处 理 程序 的 控制 转移 。 这 个 异常 处 理 程序 可 
能 处 理 这 一 问题 ， 把 控制 返回 到 这 一 个 块 ， 并 再 次 执行 引发 这 一 异常 的 操作 。 另 外 ， 这 个 异常 处 理 程序 也 
可 能 终止 执行 。 对 于 前 一 种 情况 ， 编 译 器 必须 明白 哪些 操作 可 能 引发 异常 以 及 异常 处 理 程序 的 副作用 。 后 
面 的 情况 对 优化 程序 来 说 是 透明 的 ， 因 为 执行 非 正常 结束 。 
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图 8-5 代码 片段 举例 


在 一 个 EBB 内 部 ， 编 译 器 可 以 利用 在 前 面 的 块 中 发 现 的 事实 改进 后 面 块 中 的 代码 。 超 局 部 方法 可 以 
把 通过 EBB 的 各 个 路 径 处 理 成 好 像 它们 在 一 个 块 中 那样 。 在 这 个 例子 中 ， 超 局 部 方法 可 以 使 用 在 4 中 发 
现 的 事实 改进 B8、C、D 或 E。 在 值 编号 中 ， 编 译 器 可 以 把 处 理 4 的 结果 用 作 B 和 /或 C 的 开始 点 。 编 译 器 可 
以 把 处 理 4 和 C 的 结果 用 作 刀 和 /或 有 E 的 开始 点 。 这 些 额外 的 事实 揭示 转换 和 改进 的 额外 机 会 ; 较 大 的 上 下 
文通 常 导致 较 大 的 一 组 机 会 。 


8.4.3 区 域 方法 


这 些 方法 操作 的 范围 要 比 单一 EBB 大 ， 但 比 整个 过 程 小 。 在 这 一 例子 中 ， 编 译 器 可 能 发 现 把 诸如 所 
有 7 个 块 都 考虑 成 一 个 区 域 {4，B，C，D，E，F，G} 的 优势 ， 或 者 诸如 {A4，B,，{C, D, E, F}, Ghd 
样 的 层次 作 套 分 组 区 域 的 优势 。 这 将 允许 编译 器 例如 在 考虑 F 时 使 用 从 C、D 和 E 得 来 的 事实 。 

区 域 方法 集中 于 比 过 程 小 的 作用 域 上 。 在 某 些 情况 下 ,这 产生 能 够 引发 转换 的 更 强大 的 分 析 。 例 如 ， 
在 一 个 循环 储 套 的 内 部 ， 编 译 器 也 许 能 够 证 明 一 个 频繁 使 用 的 指针 是 不 变量 〈 取 单一 值 )， 即 使 它 在 过 
程 中 其 他 地 方 被 修改 。 这 样 的 知识 可 以 带 来 诸如 把 这 一 指针 所 引用 的 值 保留 在 寄存 器 内 这 样 的 优化 。 

编译 器 可 以 用 很 多 方法 选择 区 域 。 一 个 区 域 可 能 是 由 某 个 源 代 码 控制 结构 来 定义 的 ， 例 如 一 个 循环 
KE; 另外 ， 它 也 可 能 是 诸如 支配 关系 这 样 的 图 论 性 质 所 定义 的 控制 流 图 的 一 个 子 集 〈 参 见 8.5.2 节 )。 
。 基于 循环 的 方法 遵循 一 个 简单 的 设计 : 把 优化 的 努力 集中 于 那些 最 频繁 执行 的 区 域 上 。 平 均 说 来 ， 
循环 体 比 包围 循环 体 的 代码 执行 的 次 数 要 多 ， 所 以 集中 于 循环 体 的 优化 更 有 意义 。 其 他 常用 区 域 包括 支 
配 树 的 子 树 和 静态 单一 赋值 图 中 的 环 〈 参 见 9.3 节 和 10.3 节 )。 

区 域 方 法 和 超 局 部 方法 在 处 理 CFG 中 的 合并 点 上 是 有 差异 的 。 在 合并 点 处 ， 区 域 方法 必须 具有 合并 
在 进入 这 一 合并 点 的 每 一 条 路 径 上 为 真 的 事实 集合 的 策略 。 区 域 方法 与 全 局 方法 的 差异 在 于 区 域 方法 只 
考虑 过 程 的 一 个 子 区 域 。 把 优化 集中 于 限定 的 区 域 可 能 是 强 有 力 的 ， 也 可 能 是 有 局 限 性 的 。 
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8.4.4 全 局 方法 


这 些 方法 也 称 为 过 程 内 (intraprocedural) 方法 ， 它 检查 整个 过 程 。 全 局 方法 的 动机 很 简单 : 局 部 
化 的 优化 决策 可 能 在 某 些 更 大 的 上 下 文 产生 不 好 的 结果 。 过 程 为 分 析 和 转换 提供 自然 的 边界 。 过 程 是 封 
装 和 隔离 运行 时 环境 的 抽象 。 同 时 ， 在 许多 系统 中 ， 它 们 又 充当 分 块 编译 的 边界 。 

全 局 转换 几乎 总 是 需要 全 局 分 析 。 数 据 流 分 析 促 使 我 们 去 迎接 这 一 挑战 。 因 此 ， 全 局 技术 通常 包含 
某 种 过 程 内 分 析 以 收集 事实 ， 并 通过 运用 这 些 事 实 来 确定 特定 转换 的 安全 性 和 有 效 性 。 全 局 方法 发 现 局 
部 方法 无 法 发 现 的 改进 机 会 。 


8.4.5 完整 程序 方法 


这 些 方法 也 称 为 过 程 间 方 法 (interprocedural method )， 它 们 把 整个 程序 考 虚 为 它们 的 作用 域 。 正 如 
从 局 部 作用 域 到 全 局 作用 域 的 移动 揭示 出 新 机 会 那样 , 从 单一 过 程 到 完整 程序 的 移动 也 将 揭示 出 新 机 会 。 
它 也 带 来 新 挑战 。 着 眼 于 整个 程序 ， 编 译 器 遭遇 来 自在 单一 过 程 内 不 存在 的 名 字 作用 域 规则 和 参数 绑 定 
所 带 来 的 复杂 性 和 限制 。 

我 们 把 包含 多 个 过 程 的 任意 转换 分 类 为 过 程 间 转 换 。 在 某 些 情况 下 ， 这 些 技术 分 析 整 个 程序 ， 在 其 
他 情况 下 ， 编 译 器 可 能 只 检查 源 代码 的 一 个 子 集 。 过 程 间 优 化 的 两 个 典型 例子 是 内 联 禁 换 ， 这 样 的 替换 
使 用 被 调用 过 程 体 的 措 贝 替换 这 一 过 程 的 调用 ， 以 及 过 程 间 常 量 传播 ， 它 在 整个 程序 间 传 播 和 和夫 入 有 关 
常量 的 信息 。 


8.5 比 基 本 块 大 的 区 域 上 的 值 编号 


元 余 可 能 出 现在 不 同 基本 块 的 表达 式 中 。8.3 节 中 所 给 出 的 技术 都 不 发 现 这 些 情况 ， 两 个 技术 都 把 
注意 力 限制 在 一 个 块 上 。 本 节 给 出 两 个 把 值 编 号 扩展 到 更 大 区 域 的 方法 : 首先 是 扩展 到 扩展 基本 块 ， 然 
后 是 扩展 到 更 大 的 区 域 。 对 于 值 编 号 ， 转 移 到 更 大 区 域 允 许 转换 消除 更 多 的 完 余 表达 式 。 这 一 般 导致 更 
快 的 代码 。 


8.5.1 超 局 部 值 编 号 


为 了 改进 值 编号 的 结果 ， 编 译 器 可 以 把 它 的 作用 域 从 一 个 基本 块 扩展 到 EBB。 为 了 运用 这 一 算法 ， 
编译 器 对 穿 过 EBB 的 每 一 条 路 径 做 值 编号 。 在 图 8-5 的 代码 片段 中 ， 它 必须 对 {4，B}、{A，C，D} 和 {4， 
C，E} 做 值 编号 。 考 虑 {4，C，D}。 编 译 器 在 4 上 使 用 局 部 值 编号 ， 然 后 使 用 其 结果 散 列表 作为 对 C 做 值 
编号 的 初始 状态 。 最 后 ， 编 译 器 可 以 使 用 这 一 结果 表 开 始 处 理 D。 事 实 上 ， 它 把 {4 ，C，D} 当 作 一 个 块 
处 理 。 这 一 方法 可 以 发 现 局 部 算法 不 能 发 现 的 元 余 和 常量 值 表达 式 。 | 

为 了 把 这 一 算法 用 于 第 二 条 路 径 {4，C，E}， 编 译 器 可 以 再 一 次 从 4 开始， 然后 处 理 C， 再 处 理 E。 
分 别处 理 EBB 中 的 每 一 个 路 径 ， 编 译 器 可 以 达到 理想 的 结果 。 然 而 ， 值 编号 的 代价 将 会 因为 对 像 4 这 样 
是 多 个 EBB 的 前 组 的 块 的 处 理 而 毫 无 理由 地 增加 。 在 超 局 部 化 算法 中 ， 为 了 尽 可 能 少 地 增加 编译 时 间 ， 
我 们 希望 通过 检查 已 增加 的 上 下 文 而 得 到 效益 。 为 了 实现 这 一 效益 ， 基 于 EBB 的 算法 通常 利用 EBB 的 树 
结构 。 


| 过 程 内 与 过 程 间 






编译 中 很 少 有 术语 像 单词 全 局 (global) 那样 带 来 太 多 的 混淆。 全 局 分 析 和 优化 是 在 过 程 作用 | 
域 上 操作 。 然 而 ， 现 代 英 语 的 内 涵 暗 示 全 包含 作用 域 。 
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开始 于 IBM 的 PL/I 优 化 编译 器 ， 并 在 20 世 纪 80 年 代 得 到 发 展 的 跨越 过 程 边界 的 分 析 和 优化 的 兴 | 
| 趣 导 致 对 单一 过 程 技术 的 过 程 内 (intraprocedural) 这 一 单词 的 频繁 使 用 ， 也 导致 对 跨越 两 个 或 更 多 
过 程 的 技术 的 过 程 间 (interprocedural ) 这 一 单词 的 频繁 使 用 。 因 为 这 些 单词 在 拼写 和 发 音 上 很 接近 ，| 
所 以 它们 很 容易 混淆 且 很 难 使 用 。 


Perkin-Elmer 公 司 设法 弥补 这 一 缺陷 ， 它 引入 了 “通用 (universal)” 优 化 编译 器 ; 这 一 系统 执 | 
行 广泛 的 内 联 操作 ， 接 着 在 结果 代码 上 执行 积极 的 优化 。“universal” 这 一 术语 并 非 正式 用 语 。 我 们 | 
更 喜欢 使 用 术语 全 程序 (whole program) 并 把 它 用 在 任何 可 能 的 地 方 。 它 传达 正确 的 差异 并 提醒 读 





者 和 听众 注意 : “global” PÆ “universal”. 

为 使 在 EBB 上 的 值 编 号 高 效 ， 编 译 器 必须 复 用 出 现在 EBB 的 多 条 路 径 上 的 块 的 结果 。 无 论 是 以 深度 
优先 还 是 以 广度 优先 方式 处 理 这 些 块 ， 它 都 需要 撤销 处 理 一 个 块 的 效应 的 方法 。 在 处 理 {14，C，D} 之 后 ， 
它 必须 再 次 生成 {4，C} 结 束 时 的 状态 ， 以 便 复 用 这 一 状态 来 处 理 E。 编 译 器 可 以 实现 的 众多 方法 中 包括 : 

。 它 可 以 记录 每 个 块 的 边界 处 的 表 的 状态 并 在 需要 时 恢复 这 一 状态 。 这 有 可 能 增加 算法 的 空间 需求 ， 

但 是 它 使 得 算法 对 每 个 块 只 处 理 一 次 。 

。 它 可 以 通过 向 回 遍 历 块 来 展开 释放 这 一 块 的 效应 ， 并 且 在 每 一 个 操作 处 ， 撤 销 向 前 传送 的 工作 。 

这 可 能 引发 丢失 信息 的 问题 : 如 果 一 个 操作 在 向 前 传送 中 为 x 生成 了 一 个 新 的 值 编号 ， 那 么 x 的 早 

前 的 值 编 号 是 什么 呢 ? 这 一 方法 要 求 向 前 传送 记录 某 些 额 外 的 信息 。 

。 它 可 以 使 用 为 词法 作用 域 散 列 表 所 开发 的 机 制 实现 这 一 值 表 (参见 5.7.3 节 )。 当 它 进 入 一 个 块 时 ， 

它 创 建 一 个 新 的 作用 域 。 在 撤销 一 个 块 的 效应 时 ， 它 删除 那个 块 的 作用 域 。 

所 有 三 个 方案 都 有 效 。 作 用 域 值 表 提供 最 低 的 代价 ， 特 别 是 当 我 们 复 用 为 管理 作用 域 符 号 表 所 开发 
的 机 制 时 更 是 如 此 。 因 为 编译 器 可 以 估 而 每 个 作用 域 所 需 的 表 的 大 小 ， 所 以 编译 器 能 够 避 开 符号 表 实 现 
中 由 于 这 一 符号 表 变 满 而 需要 扩展 这 一 表格 所 引发 的 复杂 性 。( 在 ILIC 代 码 片段 中 ， 名 字 的 最 大 数量 是 
ILOC 操 作 数 量 的 三 倍 。) 

使 用 作用 域 值 表 ， 仍 然 存在 一 种 复杂 性 。 如 果 一 个 名 字 在 几 个 块 中 被 定义 ， 那 么 在 一 个 块 中 的 定 
义 的 效应 可 能 被 记录 在 与 其 他 块 相关 的 作用 域 中 。 在 这 种 情况 下 ， 撤 销 表 并 删除 与 一 个 块 相 关 的 作用 


域 不 能 消除 与 这 个 块 相关 的 所 有 事实 。 值 编号 算 靶 可 能 需 修补 值 编号 已 被 取代 的 表达 式 在 其 他 作用 域 ，. 
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为 了 避 开 这 一 复杂 性 ， 编 译 器 可 以 在 每 个 名 字 刚 好 被 定义 一 次 的 表示 上 执行 超 局 部 值 编号 。 这 一 命 
名 规则 通过 保证 一 个 块 中 的 定义 被 记录 在 与 这 个 块 相关 的 值 表 的 作用 域 中 来 简化 值 编号 。 正 如 在 8.3.2 节 
中 所 讨论 的 那样 ， 这 一 命名 规则 还 可 以 使 值 编 号 更 高 效 。 

我 们 已 经 看 到 拥有 这 一 性 质 的 IR， 即 SSA 形 式 (参见 5.5 节 )。SSA 形 式 有 两 个 重要 性 质 。 每 个 名 字 
刚好 由 一 个 操作 定义 ， 以 及 一 个 值 的 每 一 次 使 用 都 刚好 引用 一 个 定义 。 前 一 个 性 质 正 是 我 们 需要 的 性 
质 ， 利 用 这 一 性 质 我 们 可 以 使 超 局 部 值 编号 的 作用 域 值 表 版 本 高 效 地 工作 。 图 8-6 给 出 我 们 例子 的 SSA 
形式 。 

在 这 一 例子 中 ， 超 局 部 算法 将 首先 处 理 所 有 穿 过 EBB{A4，、B，C，D，E} 的 路 径 ， 然 后 是 EBB{F}， 
最 后 是 EBB{G}。( 事实 上 ， 因 为 这 一 算法 不 依赖 于 每 个 EBB 的 头 部 之 前 的 上 下 文 ， 所 以 这 一 算法 可 以 以 
任意 顺序 处 理 这 些 EBB。) 具体 地 说 ， 这 些 动作 可 能 以 下 面 的 顺序 出 现 


O ”5.7.3 节 给 出 的 “ 表 束 ” 实 现 可 以 避免 这 一 问题 ， 但 是 附录 的 B4.5 节 中 给 出 的 空间 高 效 技术 把 不 同 块 中 的 定 
义 的 存储 结合 在 一 起 。 f l : 
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mo -ao + bo 
no & a + bo 











eo & bo + 18 
So — a + bo 
Up € eg + fo 


el — a) + 17 
to —Co + do 
u & e, + fo 












ez €- pleo,e1) 
Uz & p(Uos U1) 
Vo <a + bo 
Wo &— Co + do 
Xo &— e2 + fo 





rz $(rosni) 
yo — aq + bo 
Zo &— Co + do 


图 8-6 SSA 形 式 举例 


1. 为 4 生成 一 个 作用 域 12. 值 编号 E 

2. 值 编号 4 13. 删除 E 的 作用 域 

3. 为 8 生成 一 个 作用 域 14. 删除 C 的 作用 域 

4. 值 编号 B 15. 删除 4 的 作用 域 

5. 删除 8 的 作用 域 16. 为 F 生 成 一 个 作用 域 
6. 为 C 生 成 一 个 作用 域 17. 值 编号 F 

7. 值 编 号 C 18. 删除 F 的 作用 域 

8. 为 D 生 成 一 个 作用 域 19. 为 G 生 成 一 个 作用 域 
9. 值 编号 D 20. 值 编号 G 

10. 删除 D 的 作用 域 21. 删除 G 的 作用 域 


11. 为 E 生 成 一 个 作用 域 

对 于 每 个 基本 块 ， 超 局 部 算法 创建 一 个 作用 域 ， 运 用 局 部 值 编号 ， 对 当前 EBB 中 的 所 有 后 继 重复 这 
一 工作 ， 然 后 删除 这 一 作用 域 。 通 过 使 用 处 理 作用 域 的 一 个 简便 的 机 制 ， 编 译 器 设计 者 可 以 保持 超 局 部 
算法 的 代价 接近 于 局 部 算法 的 代价 。 

就 共有 效 性 来 说 ， 超 局 部 算法 比 局 部 算法 消除 更 多 的 元 余 计算 。 在 图 8-7 中 ， 这 一 算法 消除 的 计算 
用 灰色 表示 ， 其 余部 分 用 黑色 表示 。 标 以 + 的 操作 将 被 局 部 值 编号 遗漏 ， 因 为 这 些 操作 依赖 于 在 其 前 驱 
块 中 计算 的 值 。 这 一 算法 在 一 个 EBBB 内 工作 得 相当 好 。 然 而 它 遗 失 某 些 机 会 。 因 为 F 和 G 形 成 它们 自己 
的 EBB ， 在 那些 块 中 的 at+b 的 计算 不 被 处 理 为 元 余 ， 即 使 它们 实际 上 是 宛 余 的 。 同 样 地 ， 这 一 算 站 不 把 
块 P 和 G 中 的 curd 看 成 是 宛 余 的 。 
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m < ag + bo 
Np — ag + bo 
Po & co + do tqo € ao + bo 
re Cg + do rı & co + do 
















eo 人 -bo + 18 
tSo & ào + bo 
Up ey + fo 


el & a) + 17 
tto &— Co + do 
u —e, + fy 
















€& e 4b(eo,el) 
Uz + (uo, U1) 
Vo &— ao + bo 
Wo & Co + do 
Xo ep + fo 












rz — olro ri) 
Yo € âo + bo 
Zo — Co + do 






412 图 8-7 超 局 部 值 编号 的 结果 


最 后 ，F 中 的 e+fo 的 计算 揭示 出 另 一 个 问题 。 这 一 计算 是 元 余 的 ;到达 块 F 的 所 有 路 径 都 计算 e+f， 
而 且 在 F 中 的 评估 之 前 e 和 f 都 没有 被 再 定义 。 然 而 ， 这 些 计算 计算 出 不 同 的 值 ， 所 以 它们 必须 有 不 同 的 
值 编号 。 为 了 识别 这 一 宛 余 ， 我 们 需要 不 同 的 等 价 概念 ， 正 如 我 们 将 在 8.6 节 中 看 到 的 那样 。 

尽管 有 这 些 缺 点 ， 但 是 超 局 部 算法 还 是 值得 考虑 的 。 它 以 最 小 的 附加 代价 捕获 比 局 部 算法 更 多 的 元 
余 。 使 用 作用 域 散 列表 的 高 效 实现 ， 处 理 EBB 的 负 殴 可 以 维持 到 较 小 的 范围 。 

并 非 所 有 的 局 部 技术 都 可 以 清晰 地 推广 到 EBB 上 。 值 编号 可 以 很 好 地 工作 ， 因 为 它 使 用 等 价 的 值 取 
代 元 余 的 计算 。 插 入 新 操作 或 消除 现存 操作 的 技术 可 能 更 复杂 。 例 如 ， 在 超 局 部 指令 调度 中 就 会 发 生 这 
样 的 问题 。 把 一 个 操作 从 块 b5, 中 移 到 它 的 前 驱 5b; 中 必然 使 b, 的 其 他 后 继 发 生变 化 。 把 一 个 操作 从 b. 移 入 b, 
必然 要 在 b 的 其 他 后 继 中 插入 这 一 操作 的 撕 贝 。 


8.5.2 基于 支配 者 的 值 编号 


超 局 部 值 编号 算法 丢失 一 些 机 会 ， 因 为 当 它 达到 在 CFG 中 有 多 个 前 驱 的 块 时 必定 要 忽视 整个 值 表 。 
扩展 值 编号 的 作用 域 的 下 一 个 步 又 应 该 是 能 够 寻找 图 8-6 中 的 块 F 和 CG 中 的 元 余 的 技术 : 操作 是 元 余 的 ， 
因为 它们 已 在 早 前 的 EBB 中 被 计算 过 。 为 了 达到 这 一 点 ， 我 们 需要 在 CFG 中 的 连接 点 间 传播 信息 的 方法 : 
在 上 例 中 是 从 D 和 E 进 入 F 及 从 B 和 F 进 入 G 的 连接 点 。 l 

超 局 部 方法 不 能 直接 扩展 到 包含 连接 点 的 区 域 。 为 了 值 编号 ， 它 不 使 用 表示 EBB{4，C，D} 中 的 
D 的 表 ， 因 为 控制 也 可 以 从 E 进 入 。 当 然 ， 超 局 部 方法 也 不 使 用 表示 {4，C，E} 中 的 E 的 表 ， 因 为 它 未 
能 考虑 从 D 到 F 的 路 径 。 这 一 算法 将 设法 整合 D 和 E 的 值 表 。 这 一 整合 操作 将 需要 整合 沿 不 相交 的 路 径 所 

指定 的 值 编号 。 例 如 ，D 和 E 中 的 e+f 的 计算 得 到 不 同 的 值 编 号 。 同 样 重要 的 是 ， 这 一 算法 将 需要 检查 沿 
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一 条 路 径 但 不 是 沿 其 他 路 径 计 算 的 值 。F 中 b+18 的 使 用 将 找到 沿 着 从 D 进 入 F 的 路 径 的 元 余 计算 ， 而 不 是 
沿 着 从 E 进 入 F 的 路 径 的 元 余 计 算 。 因 此 ，b+18 不 是 元 余 的 。 为 处 理 合并 点 而 扩展 值 编号 化 算法 时 所 引 
发 的 复杂 性 问题 是 令 人 诅 形 的 。 





资源 限制 与 效益 
值 编 号 也 许 是 增加 作用 域 直接 导致 更 好 结果 的 最 清晰 的 例子 。 值 编号 的 目标 是 发 现 元 余 表 达 式 
并 消除 对 它们 的 宛 余 评估 。 如 8.5 节 所 指出 的 那样 ， 移 动 到 较 大 的 作用 域 导 致 算法 发 现 并 消除 更 多 的 
元 余 表 达 式 。 仍 然 存在 的 问题 是 ， 这 能 够 导致 更 快 的 代码 吗 ? 机 器 相关 的 效应 可 能 导致 消除 元 余 产 
生 较 慢 代 码 的 情况 。 
例如 ， 使 用 引用 取代 元 余 评估 可 以 延伸 由 第 一 个 评估 所 产生 的 值 的 生存 期 。 这 可 能 会 增加 对 寄 
存 器 的 需求 ， 在 最 坏 的 情况 下 ， 引 发 寄存 器 分 配器 引入 额外 的 存储 和 装 和 人 操作 来 处 理 这 一 需求 。 当 


然 ， 这 一 替换 也 可 能 减少 对 寄存 器 的 需求 ， 例 如 ， 如 果 两 个 操作 数 都 是 一 个 值 的 最 后 使 用 。 


这 一 效应 是 微妙 的 。 特 别 是 它 依赖 于 每 一 个 操作 的 执行 频率 ， 既 依赖 于 从 程序 中 消除 的 那些 操 | 
作 的 执行 频率 ， 又 依赖 于 加 入 其 中 的 那些 操作 的 执行 频率 。 计 算 特 定 替换 的 效率 包含 很 多 低级 的 细 
节 ， 包 括 所 有 其 他 替换 的 影响 。 预 测 这 一 影响 的 困难 已 促使 编译 器 设计 者 无 视 这 样 的 效应 并 假定 转 
换 是 有 利 的 。 这 一 实践 要 追溯 到 第 一 个 FORTRAN 编 译 器 ， 在 这 一 编译 器 上 ，Backus 指 示 他 的 小 组 
假设 在 优化 期 间 有 足够 多 的 可 用 寄存 器 ， 并 把 从 计算 到 寄存 器 的 映射 问题 推迟 到 后 期 遍 [25]。 





然而 存在 一 个 表 ， 算 法 可 以 使 用 它 来 处 理 下 。 到 达 F 的 两 条 路 径 有 一 个 共同 的 前 缀 {4，C}+。4 是 这 一 
代码 片段 的 惟一 入 口 。 从 4 到 F 的 每 一 条 路 径 都 经 过 4 和 C。 因 此 ， 编 译 器 知道 4 中 的 每 一 个 操作 和 C 中 的 
每 一 个 操作 都 必须 在 F 中 的 第 一 个 操作 之 前 执行 。 这 一 算法 可 以 使 用 处 理 C 而 生成 的 表 作为 处 理 F 的 初始 

D 和 E 中 的 赋值 又 如 何 呢 ?” 通 过 使 用 SSA 形 式 ， 编 译 器 可 以 避 开 在 C 和 F 之 间 值 被 再 定义 的 问题 。 
为 每 一 个 名 字 都 刚好 是 通过 一 个 操作 来 定义 的 ， 所 以 D 和 E 中 的 操作 可 以 向 值 表 添 加 信息 ， 但 是 它们 不 
能 使 其 无 效 。 如 果 F 中 的 一 个 操作 引用 在 D 或 E 中 所 创建 的 值 ， 那 么 这 个 值 的 名 字 不 能 在 C 的 表 中 。 事 实 
上 ，SSA 形 式 向 编译 器 保证 ， 如 F 中 引用 了 在 D 或 E 中 创建 的 值 ， 那 么 该 引用 将 使 用 在 F 的 顶点 处 由 9 函数 
定义 的 名 字 。( 注 意 对 于 e 的 定义 和 在 F 中 的 后 继 使 用 所 发 生 的 事情 。 比 较 图 8-5 和 图 8-6. ) 

使 用 C 的 表 初 始 化 F 的 值 编号 步骤 将 允许 编译 器 消除 aotbo 和 cotdo 的 计算 。 但 是 它 不 让 编译 器 发 现 
eztfo 已 在 沿 着 到 达 F 的 每 一 条 路 径 上 计算 过 ， 因 为 eztfo 的 值 是 在 C 和 F 之 间 计 算 的 。 

使 用 相同 的 原则 ， 这 一 算法 可 以 在 处 理 G 时 使 用 A 的 表 。 从 而 使 得 它 消除 在 G 中 对 aotbo 的 评估 ， 因 为 
原来 的 计算 出 现在 4 中 。 然 而 ， 它 不 能 消除 cotdo 的 计算 ， 因 为 早 前 的 计算 是 在 B 和 C 中 进行 的 。 

1. 支配 者 

值 编号 算法 需要 发 现 沿 着 到 达 一 个 块 的 所 有 路 径 的 最 近 公 共 祖 先 的 方法 。 检 查 例子 的 CFG， 我 们 看 
到 下 面 的 关系 成 立 : 





对 于 每 一 种 情况 ， 这 一 关系 选择 位 于 每 一 条 从 4 到 这 一 结 点 的 路 径 上 的 最 近 的 前 驱 。 因 为 4 没有 前 驱 ， 所 
以 A 没 有 这 样 的 结 点 。 这 一 关系 是 支配 者 (dominator) 关系 的 一 种 形式 。 
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在 CFG 中 ， 如 果 结 点 x 出 现在 从 图 的 入 口 到 y 的 每 一 条 路 径 上 ， 那 么 我 们 说 x 支配 y， 记 作 x.>>y。 根 
据 定义 ，x>>x。 如 果 x>> y， 且 xy， 那 么 x 严格 支配 y， 记 作 x2> y。y 的 支配 者 的 全 集合 记 作 DOM(y)。 
DOM(F) 就 是 {A4，C，F}。y 的 立即 支配 者 (immediate dominator) 是 最 接近 y 的 严格 统治 者 。 记 作 
IDOM(y)。 
这 一 例子 表明 一 个 结 点 可 以 有 多 个 支配 者 。 结 点 4 和 C 位 于 从 4 到 天 的 每 一 条 路 径 上 ， 所 以 4 之 下 ， 
415| C 之 上 且 F 之 FF。 下 面 的 表 给 出 上 面 例 子 的 支配 者 全 集合 。 


A B C D E F. G 
= {A} {A} {A, C} {A, C} {A, C} {A} 
{A} {A, B} {A, C} {A, C, D} {A, C, E} {A, C, F} {A, G} 

一 A A Ç C 2) A 





上 表 中 的 最 后 一 行 给 出 每 个 块 的 IDOM。 这 些 集合 与 区 域 值 编号 算法 有 什么 关系 呢 ? 

对 于 块 b»，DOM(b) - {5b} 中 的 每 一 个 块 必须 在 到 达 b 的 每 一 条 路 径 上 执行 。 因 此 ， 在 对 5b 的 值 编号 中 ， 
编译 器 知道 DOM(b) — {5b} 中 的 每 个 块 在 b 之 前 已 经 执行 。 编 译 器 可 以 使 用 DOM(b) - {b} 中 的 任意 块 的 值 
表 初 始 化 b 的 值 表 。 这 些 块 中 哪个 最 好 呢 ? 

IDOM(b) 是 DOM(b) - {5b} 中 的 块 ， 且 是 最 大 的 DOM 和 集合 ， 即 如 果 i=IDOM(b)， 那 么 ， 对 于 其 他 
每 一 个 jEDOM(b) - {b}, DOM(i) 包含 i (以 及 DOMOQO))。 编 译 器 应 该 使 用 i 的 表 来 初始 化 b 的 值 表 ， 
为 i 出 现在 通 向 b 的 每 一 条 路 径 上 ， 且 i 的 值 表 包 含 的 信息 比 DOM(b) - {5b} 中 其 他 任意 结 点 所 包含 的 信息 
都 多 。 

为 了 运用 这 一 观察 ， 优 化 器 可 以 把 局 部 值 编号 方法 运用 到 每 一 个 块 。 对 于 块 5»， 优 化 程序 应 该 使 用 
在 块 IDOM(b) 的 末端 运用 的 作用 域 值 表 。 这 与 我 们 曾经 用 于 超 局 部 值 编 号 的 扩展 和 撤销 作用 域 的 基本 框 
架 相符 。DOM 和 IDOM 的 计算 将 在 9.3.1 节 中 描述 。 

2. 对 值 编 号 使 用 IDOM 

我 们 可 以 通过 构建 控制 图 的 支配 者 树 (dominator tree) 来 可 视 化 IDOM 关 系 。 在 这 一 树 中 ， 一 

点 的 父 结 点 是 它 的 立即 支配 者 。 对 于 这 一 正在 进行 的 例子 ， 支 配 者 树 如 下 图 所 示 : 


对 于 给 定 结 点 ， 例 如 D，IDOM(D) 是 它 在 支配 者 树 中 的 父 结 点 ， 而 它 的 DOM 集 合 包 含 其 本 身 ， 以 
及 这 一 树 中 它 的 所 有 祖先 。 因 此 ，IDOM(D) ÆC, 而 DOM(D) Æ{D, C, A}. 
基于 支配 者 树 的 值 编号 算法 前 序 遍 历 支配 者 树 。 这 保证 在 访问 一 个 块 之 前 已 经 构建 一 个 适当 的 表 。 


这 可 能 产生 与 直观 相反 的 遍历 顺序 ， 例 如 ， 算 法 在 F 之 前 访问 G。 因 为 在 访问 G 时 这 一 算法 可 以 使 用 的 惟 
一 事实 是 在 处 理 4 时 发 现 的 事实 ， 它 不 仅 没 有 给 出 F 和 G 的 相对 顺序 ， 而 且 它 们 也 是 不 相关 的 。 
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8.6 全 局 宛 余 消除 


值 编号 通过 分 析 程 序 中 值 的 使 用 ， 识 别 有 相 同 值 的 表达 式 ， 并 重 写 代 码 来 消除 元 余 的 计算 。 它 集中 
处 理 值 、 而 不 是 名 字 。 可 以 用 一 种 直接 的 方式 扩展 它 的 作用 域 以 包含 CFG 的 较 大 部 分 。 无 论 是 超 局 部 值 
编号 还 是 基于 支配 者 的 值 编号 都 不 能 沿 循环 的 后 边 传 播 信息 。 因 此 ， 它 们 失去 发 现 某 些 元 余 操 作 的 机 会 。 

超 局 部 和 基于 支配 者 的 值 编号 算法 都 在 单一 遍 内 执行 CFG 中 的 某 个 区 域 上 的 分 析 和 转换 。 因 为 它们 
不 能 沿 着 CFG 中 的 循环 传播 信息 ， 所 以 它们 在 发 现 机 会 时 重 写 代码 。 

处 理 整 个 循环 的 算法 有 可 能 找到 更 多 的 元 余 操 作 。 然 而 ， 这 一 算法 必须 在 它 能 够 向 这 一 循环 的 先头 
的 块 传播 信息 之 前 处 理 整个 循环 。 因 此 ， 在 分 析 整 个 循环 之 前 ， 它 不 能 重 写 头 部 块 。 在 分 析 和 重 写 第 一 
块 之 前 ， 它 不 能 重 写 第 二 块 ， 以 此 类 推 。 为 了 解决 这 一 问题 ， 大 多 数 全 局 优化 算法 把 分 析 与 转换 分 离开 
来 。 对 于 宛 余 消 除 ， 这 要 包含 一 个 识别 出 所 有 一 定 是 宛 余 的 表达 式 的 阶段 ， 其 后 再 跟 一 个 重 写 所 有 代码 
来 消除 多 余 评估 的 阶段 。 

发 现 元 余 表 达 式 的 典型 方法 使 用 数据 流 分 析 (data-flow analysis) 来 计算 在 每 一 个 块 的 入 口 处 可 用 
(available) 的 表达 式 集合 。 术 语 可 用 的 定义 如 下 所 示 : 

“一 个 表达 式 e 在 CFG 中 的 点 p 处 被 定义 (defined)， 如 果 它 的 值 在 p 处 被 计算 。 我 们 称 p 是 e 的 定义 场 

所 (definition site). 417 

。 一 个 表达 式 e 在 CFG 中 的 点 p 处 被 杀 死 (killed )， 如 果 它 的 一 个 或 多 个 操作 数 在 p 处 被 定义 。 我 们 称 

P 是 e 的 杀 死 场所 (kill site). 

* 一 个 表达 式 e 在 CFG 中 的 点 p 处 可 用 (available )， 如 果 通 向 p 的 每 一 条 路 径 都 包含 一 个 e 的 先前 定义 ， 

且 e 不 会 在 这 个 定义 与 p 之 间 被 杀 死 。 

知道 表达 式 e 在 p 处 可 用 本 身 不 会 使 代码 运行 得 更 快 。 编 译 器 必须 重 写 代码 以 利用 这 一 信息 。 最 简单 
的 重 写 方案 是 创建 一 个 新 的 临时 变量 来 保存 e 的 值 ， 需 要 时 插入 把 e 的 早 前 评估 拷贝 到 这 个 临时 变量 中 的 
代码 ， 并 用 临时 变量 的 拷贝 取代 元 余 评 估 。 l 

我 们 按 以 下 的 方式 分 解 全 局 元 余 消 除 的 处 理 。 首 先 ， 我 们 给 出 计算 在 通 向 每 一 个 块 的 入 口 处 可 用 的 
表达 式 集 合 的 算法 。 其 次 ， 我 们 描述 一 个 简单 的 重 写 代码 并 取代 元 余 表达 式 的 机 制 。 最 后 小 节 把 全 局 宛 
余 消 除 的 结果 与 各 种 值 编 号 算法 做 一 个 比较 。 

名 字 的 作用 

就 其 核心 ， 全 局 元 余 消 除 依 赖 于 元 余 的 语法 概念 。 它 找到 e+f 的 重复 评估 ， 因 为 这 些 评估 都 使 用 eo 和 
f 的 名 字 。 因 此 ， 它 操作 于 程序 原来 的 名 字 空 间 ， 而 不 是 SSA 的 名 字 空 间 。 它 通过 跟踪 变量 被 杀 死 的 地 
点 来 避免 对 译本 名 字 的 和 需求。 因此， 在 序列 
xeedf 

e 人 5 
ye 十 f 


中 ， 它 识别 出 e+f 的 第 二 次 出 现 不 是 宛 余 的 ，e 的 再 定义 杀 死 表达 式 e+f。 
为 了 表示 可 能 是 元 余 的 表达 式 集合 ， 编 译 器 需要 对 每 一 个 这 样 的 表达 式 有 一 个 不 同 的 名 字 。 编 译 器 
能 够 容易 地 构造 出 这 样 的 名 字 。 利 用 值 编号 的 一 个 关键 思想 ， 编 译 器 可 以 使 用 散 列表 构建 从 表达 式 到 名 
字 的 上 映射。 在 对 CFG 的 一 次 线性 遍历 中 ， 编 译 器 可 以 从 每 个 操作 符 和 它 的 操作 数 的 名 字 构 造 出 一 个 散 列 
关键 字 ， 并 给 这 一 关键 字 指 定 一 个 独特 的 数 。 为 了 保证 有 一 个 简洁 的 名 字 空 间 ， 编 译 器 可 以 通过 递增 计 
数 器 得 到 这 些 数 。 表 达 式 名 字 的 集合 不 会 比 变量 的 集合 加 上 常量 的 集合 小 。 它 的 大 小 没有 CFG 中 的 表达 s] 
式 的 数量 大 。 
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8.6.1 计算 可 用 表达 式 


全 局 元 余 消 除 的 第 一 步 是 计算 在 程序 各 点 处 的 可 用 表达 式 集合 。 对 于 每 一 个 块 n， 这 一 计算 的 结果 
是 集合 AVAIL(n)， 这 一 集合 包含 在 通 向 块 n 的 入 口 处 可 用 的 所 有 表达 式 的 名 字 。 这 一 计算 被 形式 化 为 涉 
及 CFG 中 与 各 个 块 相关 的 集合 的 一 系列 联 立方 程 。 正 如 在 经 典 代数 中 那样 ， 这 些 方程 包含 一 些 已 知 的 集 
合 和 一 些 未 知 的 集合 。 编 译 器 使 用 某 个 已 知 的 算法 求解 这 些 方程 。 编 译 器 的 目标 是 对 每 一 个 原来 未 知 的 
集合 尽 可 能 找到 最 精确 的 值 。 

为 了 计算 AVAIL 集 合 ， 方 程 对 每 个 块 需 要 两 个 集合 ， 它 们 的 值 是 由 块 中 的 操作 惟一 确定 的 。 第 一 个 
集合 DEEXPR(n) 包含 n 中 的 向 下 暴露 的 表达 式 的 集合 。 也 就 是 说 ，eEDEEXPR(n) 当 且 仅 当 n 评 估 e 且 e 的 
任意 操作 数 都 不 在 块 中 e 的 最 后 一 次 评估 与 块 的 尾部 之 间 定 义 。 如 果 eEDEEXPR(n)， 那 么 e 在 n 的 出 口 处 
可 用 。 第 二 个 集合 EXPRKILL(n) 包含 被 7 中 定义 杀 死 的 那些 表达 式 的 全 体 。 一 个 表达 式 被 杀 死 ， 如 果 它 
的 一 个 或 多 个 操作 数 在 这 一 块 中 被 再 定义 。 如 果 e 在 通 向 n 的 入 口 处 可 用 (eEAVAIL(n)) 且 e 不 属于 
EXPRKILL(n)， 那 么 e 在 n 的 尾部 可 用 。 

给 定 所 有 块 的 DEEXPR 和 EXPRKILL 集 合 ， 编 译 器 能 够 通过 求解 下 面 的 方程 组 计算 AVAIL 和 集合 。 

AVAIL(No) = @ 
Avron) = (| (DEEXPR(m) U (AvaiL(m) N ExprKii(m))) 
mepred(n) 

这 里 ，m 是 通 向 CFG 的 人 口 结 点 ， 对 于 每 个 块 0， 方 程 寻 找 在 进入 nm 的 CFG 的 每 一 条 边 上 都 可 用 的 表 
达 式 的 集合 。 对 于 每 一 条 边 <m，n> ， 方 程 计算 沿 着 这 条 边 可 用 的 表达 式 集合 为 DEEXPR(m) 和 (AVAIL 
(用 ”EXPRKILL(m) ) 的 并 集 。 前 面 的 项 包含 在 m 中 被 定义 且 在 m 的 尾部 未 被 杀 死 的 表达 式 。 后 项 包含 
在 通 向 m 的 入口 处 可 用 且 在 m 中 不 被 杀 死 的 表达 式 。 这 两 项 的 并 集 保 证 AVAIL(m 中 的 表达 式 在 进入 n 的 所 
有 边 上 都 可 用 。 

1. 计算 局 部 集合 

编译 器 在 计算 AVAIL 集 合 之 前 需要 产生 每 一 个 块 的 DEEXPR 和 EXPRKILL 集 合 。 计 算 DEEXPR 是 直 
截 了 当 的 。 而 计算 EXPRKILL 就 更 复杂 一 些 。 图 8-8 给 出 一 个 对 基本 块 ri 计算 这 些 集合 的 算法 。 


VaRKILL ~ @ 
DEExPR e Q 


for i = number of ops in n to 1 
assume operation o; is “x — y op z” 
VARKILL 一 VARKILL U {x} 
if (y € VaRKILL) and (z ¢ VARKILL) 


then add "y op z” to DEEPXR(n) 
ExprKILL(n) — | 


for each expression e in the procedure 
for each variable v € e 
if v € VARKILL 
then EXPRKILL(n) 一 ExPRKILL(n) U {e} 





图 8-8 为 AVAIL 计 算 局 部 信息 
这 一 算法 初始 化 集合 VARKILL 和 DEEXPR(m。 接 着 ， 在 从 这 个 块 的 底部 到 其 顶部 的 遍历 中 ， 它 填 
充 这 些 集 合 。 对 于 每 个 操作 Xx<-y op z， 它 检查 y 和 Zz 是 否 是 VARKILL 的 成 员 。 如 果 二 者 都 不 在 VARKILL 
中 ， 那 么 yop Z 是 向 下 暴露 的 且 属 于 DEEXPR(n)。 因 为 这 一 操作 定义 x， 算 法 把 x 加 到 VARKILL 中 。 
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这 一 算法 的 第 二 部 分 从 VARKILL 集 合计 算 EXPRKILL(n)。 这 一 计算 是 直截了当 的 。 对 于 在 这 一 过 
程 中 计算 的 每 一 个 表达 式 e， 它 查看 n 是 否 杀 死 e 的 任意 操作 数 。 如 果 是 ， 它 把 e 加 到 EXPRKILL(n) 中 。 
为 了 加 速 这 一 计算 ， 编 译 器 可 能 要 预先 计算 从 变量 v 到 包含 这 一 变量 的 表达 式 集合 的 映射 M(Y)。 然 后 ， 
它 可 以 通过 在 VARKILL 中 的 变量 v 上 和 迭代 并 把 M(w 加 入 EXPRKILL(n) 中 来 构造 EXPRKILL(n)。 
2. 计算 AVAIL 
AVAIL 的 方程 把 AVAIL(n) 的 内 容 指定 为 DEEXPR、EXPRKILL 和 CFG 中 的 n 的 前 驱 的 AVAIL 集 合 的 
函数 。 我 们 可 以 使 用 如 图 8-9 所 示 的 简单 迭代 算法 求 出 AVAIL。 这 一 算法 假设 CFG 中 的 块 已 被 命名 为 b。 |420 
到 以。 


fori=0 tok 
Compute DEExpr(b;) and ExPRKILL(b;) as in Figure 8.8 
AvalL(b;) + 0 

Changed + true 

while (Changed) 
Changed + false 


for i= 0 tok 
OldValue + Avati(b;) 
AvaiL(b) = (Q) (DEExpr(p) U (AvaiL(p) n ExprKILL(p))) 
p € pred(b;) 
if AvAIL(b;) # OldValue then 
Changed + true 





图 8-9 可 用 表达 式 的 简单 迭代 算法 


初始 化 步骤 计算 每 一 个 块 的 DEEXPR 和 EXPRKILL 集 合 ， 并 把 所 有 AVAIEL 集 合 设置 为 空 集 。 选 代 
步骤 反复 计算 每 个 块 的 新 AVAIL。 当 AVAIL 集 合 停止 变化 时 迭代 停止 。 正 如 我 们 将 在 9.2 节 中 所 看 到 的 
那样 ，AVAIL 方 程 的 结构 ， 连 同 其 背后 问题 的 性 质 以 及 迭代 算法 的 性 质保 证 算法 将 到 达 一 个 不 动 点 并 
停止 。 : 

可 用 表达 式 是 一 个 全 局 数据 流 分 析 问 题 (global data-flow analysis problem )。 很 多 这 样 的 问题 都 在 
关于 代码 优化 的 文献 中 得 到 陈述 。 编 译 器 通过 解决 这 些 问 题 来 在 代码 中 寻找 到 可 以 安全 地 运用 相关 转 
换 的 位 置 。 求 解 这 样 的 方程 的 算法 称 为 全 局 数据 流 算法 (global data-flow algorithm)。 目 前 已 提出 很 多 
这 样 的 算法 。 如 图 8-9 所 示 的 迭代 算法 具有 稳健 性 和 简洁 性 的 优势 (这 一 算法 是 不 动 点 算法 的 另 一 个 例 
F). 


8.6.2 取代 元 余 计算 


一 旦 编译 器 得 到 CFG 中 每 个 块 的 AVAIL 集 合 ， 它 就 可 以 使 用 蕴涵 在 这 些 集 合 中 的 信息 转换 代码 。 
(信息 本 身 并 不 能 使 代码 运行 得 更 快 .) 宛 余 消 除 的 重 写 阶段 必须 使 用 在 早 前 的 评估 中 所 保存 下 来 的 元 余 
表达 式 的 值 的 拷贝 操作 取代 该 元 余 表达 式 ， 而 且 它 必 须 插 入 代码 来 保存 这 些 早 前 的 结果 。 我 们 的 算法 将 
使 用 一 个 拷贝 操作 取代 实际 的 元 余 评估 。 我 们 不 集中 精力 消除 这 些 拷贝 ， 而 是 假设 编译 器 的 后 继 阶 段 将 
消除 大 部 分 〈 如 果 不 是 全 部 的 话 ) 这 些 拷贝 操作 。 这 简化 重 写 阶段 并 允许 编译 器 对 这 一 重 写 步 难 的 结果 
使 用 它 最 强大 的 拷贝 消除 工具 。 

为 了 简化 这 一 过 程 ， 我 们 使 用 两 个 遍 。 第 一 遍 识 别 出 可 用 表达 式 可 以 被 复 用 的 位 置 ， 并 用 编译 器 新 
生成 的 临时 变量 的 拷贝 操作 重 写 那些 操作 。 第 二 饥 遍 历 这 一 代码 并 插入 必要 的 拷贝 操作 ， 这 些 挝 贝 操作 
定义 在 第 一 遍 中 编译 器 生成 的 临时 变量 。 对 应 于 一 个 实际 的 替换 ， 这 一 方法 只 生成 一 个 临时 变量 ， 并 只 


e 
N 
— 
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为 那些 临时 变量 插入 拷贝 操作 。 

(作为 一 个 选择 ， 编 译 器 可 以 把 每 个 值 保存 在 一 个 适当 的 临时 寄存 器 中 。 代 码 每 次 计算 一 个 给 定 表 
达 式 时 ， 编 译 器 插入 一 个 拷贝 操作 来 保存 它 的 值 。 这 一 方法 生成 很 多 伪 拷 贝 操作 。 尽 管 那些 额外 的 拷贝 
可 以 通过 优秀 的 死亡 代码 消除 器 来 消除 ， 但 是 尽量 避 开 插入 它们 会 更 好 些 。) 

在 第 一 遍 ， 编 译 器 可 以 在 每 一 个 块 上 执行 局 部 值 编号 ， 并 用 AVAIL(m 中 的 表达 式 初始 化 块 n 的 值 表 。 
如 果 局 部 值 编号 找到 e 在 这 一 块 中 的 一 个 评估 ， 其 中 eEAVAIL(m， 那 么 它 使 用 新 生成 的 名 字 temp; 的 拷贝 
操作 重 写 这 一 表达 式 ， 其 中 ;是 e 在 名 字 空 间 中 的 索引 ， 即 e 的 惟一 整数 标识 符 。 无 论 值 编号 什么 时 候 执 


行 这 样 的 替换 ， 编 译 器 都 通过 设置 USED(7) 为 true 来 使 用 布尔 数组 USED 记 录 这 一 事实 。 就 如 同 局 部 值 


编号 插入 的 其 他 拷贝 一 样 拷贝 操作 取代 宛 余 计 算 。 

在 第 二 所， 编译 器 为 记录 在 USED 数 组 中 的 每 一 个 表达 式 播 入 拷贝 操作 。 对 于 每 一 个 块 D， 如 果 
eEDEEXPR(n) 且 e 在 USED 中 的 条 目 为 ture， 那 么 它 必 须 在 n 中 e 的 最 后 定义 之 后 插入 一 个 把 e 的 值 移 
到 temp 中 的 拷贝 。 尽 管 这 听 起 来 很 复杂 ， 但 是 这 一 代码 上 的 一 次 线性 遍历 就 可 以 插 人 所 有 所 需 的 拷贝 
操作 。 

拷贝 播 入 的 方法 只 加 入 拷贝 来 保存 被 包含 在 宛 余 评估 中 的 表达 式 。 然 而 它 的 确 会 而 且 也 真 的 插入 不 
需要 的 拷贝 。 如 果 USED(e) 是 true， 那 么 重 写 阶 段 保存 e 的 每 一 个 剩余 评估 。 这 也 将 很 有 可 能 保存 从 来 
没有 达到 相应 的 临时 变量 的 使 用 的 e 的 某 些 评 估 。 聪 明 的 编译 器 设计 者 可 以 工程 化 重 写 策略 ， 揪 入 较 少 
的 拷贝 ， 但 是 这 必然 要 增加 重 写 时 的 额外 工作 。 由 这 一 简单 的 技术 所 插入 的 额外 拷贝 是 无 用 的 ， 也 就 是 
它们 的 值 从 不 被 使 用 。 死 亡 代码 消除 将 高 效 且 自然 地 消除 它们 。 


86.3 结合 上 述 两 个 阶段 


把 上 面 两 个 阶段 结合 起 来 ， 即 在 计算 AVAIL 的 分 析 之 后 加 上 使 用 AVAIL 初 始 化 局 部 值 编号 的 重 写 ， 
产生 从 被 表示 为 CFG 的 整个 过 程 中 消除 元 余 表 达 式 的 方法 。 这 一 结果 算法 发 现 元 余 操 作 的 集合 不 同 于 任 
意 值 编号 算法 所 发 现 的 元 余 操 作 和 集合 。 

图 8-10 给 出 我 们 例子 的 原名 字 空 间 形式 (而 不 是 SSA 有 形式 )。 因 元 余 而 被 消除 的 表达 式 以 灰色 表示 。 
这 些 表达 式 的 右 侧 标 签 给 出 这 一 系列 算法 中 可 以 发 现 和 消除 这 一 元 余 的 第 一 个 算法 。 标 签 的 含义 如 下 
所 示 : 


标签 算 法 节 


LVN 局 部 值 编号 8.3.2 
SVN 超 局 部 值 编号 8.5.1 
DVN 基于 支配 者 的 值 编号 8.5.2 
GRE 全 局 元 余 消 除 “ 8.6 


前 三 个 算法 LYN、SVN 和 DVN 形 成 严格 的 层次 关系 。DVN 发 现 由 SVN 和 和 LVN 发现 的 每 件 事情 。 同 样 地 ， 
SVN 找 到 LVN 找 到 的 每 个 宛 余 表达 式 。 另 一 方面 ，GRE 使 用 不 同 的 方法 且 找 到 在 某 种 程度 上 不 同 于 其 他 
算法 的 改进 集合 。 例 如 ， 只 有 GRE 能 够 发 现 F 中 的 e+f 的 评估 能 够 复 用 D 和 E 中 计算 的 值 。 

三 个 值 编号 算法 都 识别 相同 的 值 ， 所 以 它们 能 够 发 现 如 果 a=c 且 b=d (或 a=d 且 b=c) 那么 atb 和 c+d 
产生 同样 的 值 。 同 样 ， 集 中 于 值 的 相等 性 的 做 法 使 得 值 编号 算法 识别 出 x+0 等 于 x， 或 者 2 x y 等 于 y+y。 
因为 GRE 依 赖 于 文本 相等 ， 它 一 般 不 能 发 现 这 样 的 相等 关系 。 然 而 ， 因 为 它 使 用 LVN 来 执行 替换 ， 所 以 
它 将 发 现 基于 局 部 值 的 相等 性 的 替换 。 
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图 8-10 ”比较 算法 


8.7 高 级 话题 

通常 人 们 认为 较 大 作用 域 上 的 优化 产生 的 代码 好 于 较 小 作用 域 上 的 优化 产生 的 代码 。 对 于 值 编 号 ， 
我 们 已 经 看 到 增加 算法 可 用 的 上 下 文 可 使 值 编 号 找到 更 多 的 改进 机 会 。 另 一 方面 ， 全 局 元 余 消 除 发 现 显 
然 不 同 的 改进 集合 。 全 局 元 余 消除 可 以 找到 值 编号 方法 无 法 找到 的 某 些 机 会 。 但 是 它 也 可 能 无 法 发 现 某 
些 局 部 值 编号 能 够 找到 的 机 会 。 

然而 有 时 候 ， 增 加 优化 可 用 的 上 下 文 不 能 改进 结果 。 对 于 某 些 比 全 局 或 过 程 间 问题 中 所 看 到 的 一 般 
问题 更 简单 的 限定 问题 ， 局 部 和 超 局 部 方法 更 有 效 。 在 较 小 的 作用 内 ， 编 译 器 通常 可 以 比 在 较 大 的 作用 
域内 证 明 更 强 的 事实 。 在 更 大 的 作用 域 ， 分 析 也 更 加 困难 ， 控 制 流 的 相互 作用 和 名 字 空 间 的 处 理 更 加 复 
杂 性 。 较 大 的 作用 域 揭示 出 更 多 的 优化 机 会 ; 遗憾 的 是 ， 这 些 机 会 只 允许 较 弱 的 分 析 。 

把 分 析 和 转换 的 作用 域 从 单一 块 【 或 EBB) 上 扩展 到 包含 CFG 内 连接 点 的 较 大 区 域 上 引发 控制 流 的 
不 确定 性 。 在 单一 基本 块 内 ， 编 译 器 知道 只 有 一 条 路 径 可 以 执行 。 穿 过 EBB 的 路 径 排斥 连结 点 ， 所 以 编 


译 器 知道 在 这 一 EBB 中 哪些 块 总 是 先 于 给 定 的 块 。 区 域 方法 和 全 局 方法 包含 连接 点 ;这 些 块 的 代码 必须 


作为 通过 代码 的 多 条 路 径 的 一 部 分 正确 地 发 挥 功能 。 其 中 有 些 路 径 可 能 是 不 可 实行 的 ， 即 它们 从 不 执行 。 
如 果 编 译 器 能 够 发 现 不 可 实行 路 径 ， 那 么 它 就 可 以 在 分 析 期 间 忽 视 它们 。 如 果 编 译 器 不 能 发 现 这 些 不 可 
实行 路 径 (这 是 一 般 情况 ) ， 它 必须 假设 它们 是 可 以 执行 的 。 穿 过 CFG 的 所 有 路 径 是 可 执行 的 假设 降低 
分 析 的 精确 性 ， 而 且 限制 编译 器 转换 代码 的 能 力 。 

把 分 析 和 转换 的 作用 域 从 单一 过 程 扩展 到 包含 多 个 过 程 导致 更 复杂 的 情况 。 完整 程序 ， 或 过 程 间 方 
法 必须 模型 化 过 程 调用 时 名 字 空 间 改变 的 方式 。 值 变 得 不 可 存 取 ; 值 被 重 命名 ; 值 不 再 存在 。 当 一 个 过 
程 被 若干 过 程 调用 时 ， 每 一 个 过 程 都 带 有 自己 的 上 下 文 ， 被 调用 过 程 的 代码 必须 在 其 中 每 一 个 上 下 文 内 
以 及 相应 的 名 字 空间 内 都 能 够 正确 地 工作 。 这 些 影 响 在 大 多 数 单一 过 程 分 析 问 题 中 不 会 出 现 。 

转换 作用 域 的 增加 还 增加 它 对 资源 分 配 产 生 广 泛 影 响 的 六 在 能 力 。 例 如 ， 很 多 转换 增加 对 寄存 器 的 
需求 ， 这 一 需求 有 时 称 为 寄存 器 压力 (register pressure)。 如 果 转 换 产 生 太 多 的 寄存 器 压力 ， 那 么 分 配 
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器 可 能 插入 足够 多 的 溢出 代码 而 抵消 原 有 的 改进 。 因 此 ， 转 移 到 更 大 的 优化 作用 域 需要 坚信 新 方法 的 力 
量 强 大 ， 卫 坚信 编译 器 的 其 余部 分 处 理 结果 代码 的 能 力 。 这 通常 是 可 获 利 的 。 然 而 ， 有 时 候 较 小 的 优化 
作用 域 能 获取 更 大 的 利益 。 

有 了 时候， 编译 器 复制 代码 来 增加 对 优化 可 用 的 上 下 文 ， 并 创建 新 的 优化 机 会 。 本 节 描 述 两 个 复制 方 
法 : 在 一 个 过 程 内 复制 块 ， 以 及 在 调用 一 个 过 程 的 地 方 用 整个 过 程 来 做 替换 。 这 些 技术 给 本 章 的 主题 ， 
即 我 们 能 够 通过 修改 算法 来 处 理 更 大 、 更 复杂 的 区 域 ， 提 供 一 个 相反 的 方向 。 相 反 ， 这 些 方法 通过 修改 
代码 来 创建 带 有 简单 控制 流 的 更 大 区 域 。 


8.7.1 通过 复制 增加 上 下 文 


各 种 值 编号 算法 证 明 ， 在 更 大 的 作用 域 中 使 用 优化 可 以 带 来 额外 的 改进 机 会 。 然 而 ， 即 使 是 基于 支 
配 者 的 技术 也 无 法 找到 某 些 可 能 的 赫 换 。 在 上 面 的 例子 中 ，e+f 在 块 F 中 的 评估 和 ctd 在 块 G 中 的 评估 显 
然 是 元 余 的 : 两 个 表达 式 都 在 沿 着 从 入 口 点 出 发 的 每 一 条 路 径 上 被 评估 。 然 而 ， 所 有 值 编号 技术 都 无 法 
发 现 它们 并 替换 它们 。9 

这 两 个 表达 式 都 出 现在 在 CFG 中 有 多 个 前 驱 的 块 中 。 常 常 CFG 中 的 这 些 合并 点 引发 优化 期 间 的 信息 
遗失 。 为 了 解决 这 些 问 题 ， 编 译 器 有 时候 通过 复制 基本 块 来 消除 合并 点 。 

为 了 复制 一 个 块 ， 编 译 器 把 这 个 块 的 拷贝 附加 到 每 一 个 前 驱 块 的 尾部 。 图 8-11 给 出 在 我 们 的 例子 中 
复制 块 F 和 块 G 的 结果 。 这 创建 三 个 新 块 B'、D' 和 E'。 在 这 一 图 中 ， 灰 色 部 分 表示 原来 块 的 边界 。 图 中 从 
G 的 每 一 个 拷贝 出 发 的 向 外 的 边 提醒 我 们 编译 器 必须 把 每 一 个 找 贝 与 原来 块 G 的 每 一 个 原来 的 后 继 连 接 
起 来 。 





图 8-11 复制 后 的 例子 


以 这 样 的 方式 复制 块 从 下 面 三 个 主要 方面 改进 优化 结果 。 

1) 这 种 复制 方式 创建 较 长 的 块 。 较 长 的 块 使 局 部 优化 处 理 更 多 的 上 下 文 。 对 于 值 编号 的 情况 ， 超 
局 部 和 支配 者 版 本 与 局 部 版 本 一 样 强大 。 然 而 ， 对 于 某 些 技术 ， 情 况 并 非 如 此 。 例 如 ， 对 于 指令 调度 ， 
超 局 部 和 支配 者 版 本 比 局 部 方法 更 弱 。 在 这 一 情况 下 ， 进 行 复制 并 随后 使 用 局 部 优化 可 能 产生 更 好 的 


日 、 全 局 元 余 消除 有 其 自己 的 弱点 。 在 序列 x-atd、y*-a 和 zytd 中 ， 全 局 宛 余 消 除 不 能 发 现 x 和 z 得 到 相同 
的 值 。 
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代码 。 

2) 这 种 复制 方式 消除 分 支 。 组 合 两 个 块 消除 它们 之 间 的 分 支 。 分 支 消耗 执行 时 间 。 它 们 还 破坏 处 
理 器 中 某 些 与 性 能 紧密 相关 的 机 制 ， 诸 如 指令 抽取 以 及 很 多 管道 函数 。 消 除 分 支 的 净 效 应 是 缩短 执行 时 
间 ， 其 手段 是 消除 操作 并 使 得 预测 行为 的 硬件 机 制 更 有 效 。 

3) 这 种 复制 方式 产生 优化 可 能 出 现 的 地 点 。 当 复制 消除 一 个 合并 点 时 ， 它 可 能 在 程序 中 创建 新 地 
点 ， 编 译 器 在 这 些 点 处 可 以 得 到 更 精确 的 运行 时 上 下 文 的 信息 。 例 如 ， 在 块 D' 中 ， 实 量 x 得 到 值 br18+f， 
而 在 E' 中 ，x 得 到 值 a+17+f。 -在原 代码 中 的 任意 点 都 没有 这 样 的 性 质 。 

当然 ,复制 也 有 它 自己 的 代价 。 复 制 之 后 ， 上 述 的 例子 有 24 个 算术 操作 ， 而 不 是 原来 的 17 个 。 更 大 
的 代码 可 能 运行 得 更 快 ， 因 为 它 避 开 某 些 块 未 端的 跳 转 。 如 果 它 的 大 小 引发 额外 的 指令 缓冲 失败 ， 那 么 
它 也 可 能 运行 得 更 慢 。 它 也 可 能 允许 更 高 效 的 优化 ; 例如， 局 部 值 编号 算法 现在 能 够 识别 出 表达 式 
x<-etf 的 两 次 出 现 是 元 余 的 。 在 用 户 更 关心 代码 空间 而 不 是 速度 的 运用 中 ， 复 制 可 能 不 具有 效率 。 


8.7.2 内 联 蔡 换 


过 程 调用 给 优化 带 来 严重 的 障碍 。 对 另外 一 个 过 程 的 调用 有 直接 的 代价 ; 程序 必须 执行 调用 序列 中 
的 所 有 操作 。 在 某 些 情况 下 ， 调 用 序列 比 需要 的 更 一 般 。 对 另外 一 个 过 程 的 调用 有 间接 的 代价 ; 除非 编 
译 器 有 关于 被 调用 者 的 行为 的 精确 信息 ， 否 则 它 必 须 假设 被 调用 者 有 不 利 的 行为 :修改 它 能 够 存 取 的 每 
一 个 值 。 在 很 多 情况 下 ， 编 译 器 不 能 得 到 这 一 信息 ， 而 且 调 用 过 程 中 的 代码 质量 也 因此 受到 影响 。 

类 似 的 效应 也 发 生 在 被 调用 者 中 。 当 编译 器 翻译 一 个 过 程 时 ， 它 做 有 关 运 行 时 环境 的 假设 : 代码 将 
继承 它 的 调用 者 。 在 缺乏 精确 信息 的 情况 下 ， 编 译 器 必须 保证 被 调用 者 在 任意 合法 的 环境 中 都 能 正确 操 
作 。 使 用 更 好 的 信息 ， 编 译 器 通常 可 以 生成 更 有 效 、 特 化 的 代码 。 

由 于 缺乏 信息 引发 某 些 低 效 性 。 如 果 编 译 器 能 够 在 编译 一 个 程序 的 任意 部 分 之 前 分 析 整 个 程序 ， 那 
么 它 就 可 以 解决 这 一 问题 。 其 余 的 低 效 性 则 是 过 程 型 程序 设计 固有 的 。 一 个 过 程 可 以 从 不 同 的 调用 场所 
调用 ， 每 一 个 调用 场所 都 带 有 不 同 的 运行 时 条 件 集 合 。 只 要 编译 器 必须 构建 对 于 所 有 调用 场所 都 可 行 的 
单一 可 执行 代码 ， 那 么 为 了 一 般 性 其 结果 代码 必定 在 某 些 调用 上 下 文中 条 和 性 有 效 性 。 

为 了 抗击 这 些 无 效 性 ， 编 译 器 可 以 执行 内 联 替 换 (inline substitution), BAR (inlining )。 这 一 转 
换 使 用 被 调用 过 程 体 替换 调用 该 过 程 的 调用 场所 ， 且 在 替换 时 使 用 适当 的 命名 和 拷贝 来 模拟 原来 调用 场 
所 的 参数 绑 定 效应 。 图 8-12 有 两 个 调用 者 fee 和 fie 的 代码 片段 。 这 两 个 调用 者 都 调用 foe。 对 所 有 对 foe 
的 调用 使 用 foe 的 过 程 体 进行 替换 创建 如 图 8-13 所 示 的 情况 。fee 和 fie 都 有 foe 中 的 代码 的 私有 拷贝 。 编 
译 器 可 以 使 用 包围 这 些 拷贝 的 代码 剪裁 它们 。 与 原来 的 三 过 程 代码 相 比 ， 替 换 的 结果 可 能 是 有 两 个 新 过 
程 的 更 好 代码 ， 其 代价 是 更 大 的 代码 空间 。 

有 若干 可 能 的 改进 。 

1) 更 有 效 的 优化 。 消 除 调用 把 调用 者 和 被 调用 者 的 代码 同时 暴露 给 同一 个 分 析 和 转换 。 编 译 器 可 
以 得 到 更 精确 的 信息 ， 并 把 一 信息 运用 于 这 一 程序 的 更 大 部 分 ， 即 结合 起 来 的 过 程 。 

2) 消除 操作 。 内 联 foe 的 过 程 体 消 除 调用 序列 中 的 大 部 分 操作 。 这 包括 保存 和 恢复 寄存 器 、 建 立 可 
寻 址 性 以 及 执行 跳 转 或 分 支 来 转移 控制 。 变 量 存 取 可 能 变 得 更 简单 例如， 通过 内 情 向 量 存 取 数组 值 ) 。 

当然 ， 内 联 蔡 换 在 改进 代码 方面 的 成 功 只 取决 于 优化 器 和 代码 生成 器 能 够 利用 这 些 机 会 的 程度 。 其 
潜在 的 隐患 包括 由 于 代码 增加 以 及 寄存 器 需求 的 增加 引发 的 问题 。 

(内 联 替 换 消除 调用 序列 中 的 保存 和 恢复 行为 ， 这 一 行为 破坏 调用 场所 之 间 的 值 流向 。 这 一 “分 裂 ” 
行动 改变 寄存 分 配 问题 。 如 果 调 用 出 现 于 寄存 器 需求 高 的 区 域 ， 那 么 内 联 可 能 使 事态 更 精 ， 而 且 诱 发 额 
外 的 寄存 器 溢出 。 由 于 寄存 器 溢出 的 某 些 突 发 事件 ， 调 用 场所 的 需求 可 能 诱发 程序 中 其 他 部 分 的 溢出 。) 
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图 8-12 内 联 替 换 之 前 














图 8-13 内 联 替换 之 后 


8.8 概括 和 展望 


现代 编译 器 中 的 优化 器 包含 一 系列 试图 改进 编译 代码 性 能 的 技术 。 大 多 数 优化 设法 加 速 可 执行 代码 。 
对 于 某 些 应 用 ， 诸 如 代码 大 小 或 能 量 消 耗 等 其 他 度量 非常 重要 。 本 章 深入 研究 了 元 余 消 除 ， 并 利用 它 来 
探究 优化 器 中 出 现 的 一 些 问 题 。 

优化 是 通过 对 照 手边 代码 的 特殊 细节 剪裁 一 般 的 翻译 方案 来 改进 程序 的 性 能 。 优 化 器 中 的 转换 设法 
消除 在 支持 源 语言 抽象 中 带 来 的 负荷 ， 其 中 包括 数据 结构 、 控 制 结 构 以 及 错误 检查 。 这 些 转换 设法 识别 
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出 有 效 实现 的 特殊 情况 ， 并 重 写 代码 来 实现 这 些 成 本 削减 。 对 照 处 理 器 的 实际 可 用 资源 ， 它 们 设法 匹配 
程序 对 资源 的 需求 ， 包 括 功能 单元 、 内 存 层 次 上 每 一 层次 上 的 有 限 存储 (寄存 器 、 高 速 缓存 、 翻 译 后 备 
缓冲 器 以 及 内 存 )、 移 动 数据 的 各 种 带宽 以 及 指令 级 并 行 等 。 

在 优化 器 可 以 运用 任意 转换 之 前 ， 它 必须 确定 这 一 代码 的 计划 重 写 是 安全 的 : 它 保持 代码 原 有 的 意 
义 。 这 通常 要 求 优 化 器 分 析 代码 。 在 值 编号 方法 中 ， 构 造 散 列 关键 字 并 执行 查找 的 过 程 保证 击 中 值 表 的 
操作 必定 是 在 这 一 块 中 或 其 前 驱 块 中 遇 到 的 一 个 操作 的 拷贝 。 在 全 局 元 余 消 除 中 ， 优 化 器 通过 计算 可 用 
表达 式 来 发 现 哪些 表达 式 在 通 向 每 个 块 的 和 人口 处 一 定 是 可 用 的 ， 因 而 可 以 用 拷贝 操作 替换 这 些 表达 式 。 

一 旦 优化 器 确定 运用 一 个 转换 是 安全 的 ， 那 么 它 必 须 决定 它 是 否 改进 代码 。 对 于 本 章 所 描述 的 宛 祭 
消除 的 形式 ， 编 译 器 在 没有 深入 分 析 的 情况 下 假设 它们 改进 代码 。 这 一 假设 有 三 个 重要 成 份 : (1) 拷贝 
至 少 与 执行 原来 操作 一 样 廉价 ; (2) 元 余 消 除 加 入 的 大 部 分 拷贝 后 来 被 消除 ; 以 及 (3) 宛 余 消除 增加 
的 对 寄存 器 的 需求 不 超过 它 的 利益 。 如 果 所 有 这 些 假设 成 立 ， 而 且 代 码 包 含 元 余 表达 式 ， 那 么 任意 形式 
的 元 余 消 除 都 将 改进 代码 。 

本 章 介绍 了 优化 中 出 现 的 很 多 术语 和 论点 。 对 此 课题 的 更 多 资料 ， 有 兴趣 的 读者 可 以 参考 数据 流 分 
析 (第 9 章 ) 和 标量 优化 (第 10 章 )。 


本 章 注释 


8.2 节 的 例子 来 自 于 出 现在 LINPACK 库 中 的 基础 线性 代数 子 例 程 [123]。 讨 论 暗 示 ， 循 环 展开 有 其 他 
效应 。Kennedy 指 出 编译 器 可 以 使 用 循环 展开 来 消除 循环 中 的 寄存 器 到 寄存 器 找 贝 [202]; Copper 和 
Waterman 指 出 循环 展开 可 以 改变 某 些 处 理 器 上 的 能 源 消耗 [102]。 

人 们 很 早 就 认识 到 了 通过 寻找 并 消除 元 余 而 带 来 的 代码 改进 的 机 会 。20 世 纪 50 年 代 Ershov 在 一 个 系 
统 中 实现 了 其 中 的 某 些 效应 [131]。Floyd 提 到 了 改进 的 可 能 性 ， 以 及 使 用 交换 性 可 能 带 来 的 影响 [143]。 

局 部 值 编号 通常 归功 于 20 世 纪 60 年 代 后 期 的 Balke[15，86]。 到 EBB 的 扩展 很 自然 ， 而 且 毫 无 疑问 已 
在 很 多 编译 器 中 得 到 了 实现 。 我 们 给 出 的 超 局 部 和 基于 支配 者 的 值 编号 的 特殊 算法 归功 于 Simpson[306， 
50]。( 参 见 第 9 章 关 于 支配 者 的 注释 。) 

| Cocke 描 述 了 使 用 可 用 表达 式 来 执行 金 局 公共 子 表达 式 消 除 [82]。 这 一 论文 清楚 地 把 优化 分 解 成 分 
析 问 题 及 其 后 的 转换 。 后 续 的 工作 精炼 并 改进 了 基于 可 用 性 的 元 余 消 除 的 概念 。 例 如 ， 参 见 10.3.2 节 中 
的 情 性 代码 运动 的 描述 。 

代码 复制 是 一 个 老 想 法 [151]。 块 复制 已 用 于 改进 调度 [190] 及 元 余 消 除 [41]。 内 联 替 换 得 到 了 广泛 的 

应 用 与 研究 [111，290，93]。 


第 9 章 


数据 流 分 析 





9.1 概述 


正如 我 们 在 第 8 章 所 看 到 的 那样 ， 优 化 是 分 析 一 个 程序 并 对 这 一 程序 进行 转换 以 改进 它 的 运行 时 行为 
的 过 程 。 在 编译 器 能 够 改变 代码 之 前 ， 它 必须 定位 程序 中 的 某 些 点 ， 在 这 些 点 改变 代码 有 可 能 改进 代码 ， 
而 且 编 译 器 必须 证 明 在 这 些 点 处 改变 代码 是 安全 的 。 与 编译 器 的 前 端 相 比 ， 这 两 项 任务 都 要 求 编译 器 对 
代码 的 理解 更 深入 。 为 了 收集 定位 机 会 和 证 明 优 化 所 需要 的 信息 ， 编 译 器 使 用 静态 分 析 的 某 种 形式 .。 

静态 分 析 一 般 包括 在 编译 时 对 运行 时 发 生 的 情况 加 以 推断 ， 其 中 包括 值 在 运行 时 是 如 何 流动 的 ， 以 
及 运行 时 变量 取 什 么 样 的 值 。 在 简单 的 情况 下 ， 这 可 以 产生 精确 的 值 ， 编 译 器 能 够 精确 地 知道 当代 码 执 
行 时 将 发 生 什么 。 如 果 编 译 器 能 够 得 到 精确 的 信息 ， 那 么 它 可 以 使 用 表达 式 或 函数 结果 的 一 个 立即 装 入 
取代 其 运行 时 评估 。 另 一 方面 ， 如 果 代码 从 任意 外 部 设备 读 取 值 ， 甚 至 包括 一 定量 的 控制 流 ， 或 遇 到 任 
意 的 (从 指针 、 数 组 引用 或 引用 参数 调用 而 来 的 ) 歧义 性 内 存 引用 ， 那 么 分 析 代码 就 会 变 得 更 困难 而 且 
分 析 的 结果 将 缺乏 精确 性 。 

在 第 8 章 ， 我 们 开发 了 一 系列 寻找 和 消除 宛 余 ， 也 就 是 寻找 和 消除 必定 产生 相同 结果 的 操作 的 技术 。 
在 某 些 情况 下 ， 编 译 器 知道 结果 的 值 ， 并 能 够 用 它 的 值 简单 地 取代 计算 。 在 另外 一 些 情况 下 ， 编 译 器 不 
知道 这 些 值 ， 但 是 它 仍然 可 以 通过 消除 元 余 操 作 来 改进 代码 。 所 有 这 些 方 法 都 得 自 于 静态 分 析 。 

局 部 和 超 局 部 值 编号 算法 得 到 直线 代码 中 值 流动 的 相当 精确 的 信息 〈 参 见 8.3.2 节 和 8.5.1 节 )。 它 们 
依次 检查 操作 并 记录 这 些 操 作 的 可 能 效应 。 这 些 方法 的 精确 性 大 部 分 直接 来 自 于 这 些 算法 只 处 理 有 限 种 
类 的 控制 流 的 事实 。 同 样 的 事实 也 限制 它们 操作 的 范围。 

基于 支配 者 的 值 编号 (dominator-based value-numbering, DVN) 算法 分 析 并 改进 更 大 范围 的 代码 
(参见 8.5.2 节 )。 控 制 流 是 分 析 中 的 一 个 限制 因素 。 当 DVN 处 理 带 有 多 个 前 驱 的 块 时 ， 它 必须 放弃 位 于 当 
前 块 和 它 的 立即 支配 者 之 间 的 块 的 信息 。 因 为 同样 的 原因 ，DVN 从 不 能 识别 出 封闭 一 个 循环 的 后 边 所 携 
带 的 元 余 。 

基于 可 用 表达 式 的 全 局 公共 子 表达 式 消 除 采用 不 同 的 方法 (参见 8.6 节 )。 它 执行 数据 流 分 析 并 利用 
其 分 析 结 果 ， 使 用 对 早 前 计算 的 引用 来 取代 宛 余 评 估 。 它 处 理 任 意 控制 流 ， 但 是 可 以 发 现 的 元 余 种 类 
有 更 大 的 局 限 性 。 可 用 表达 式 的 基于 集合 的 分 析 无 法 跟踪 赋值 中 的 值 。 它 无 法 凭借 自己 识别 和 简化 算 
术 等 式 。 

正如 我 们 所 看 到 的 那样 ， 编 译 器 可 以 在 不 同 的 作用 域 上 执行 静态 分 析 。 局 部 值 编号 执行 局 部 分 析 。 
可 用 表达 式 中 的 EXPRKILL 集 合 的 计算 也 是 局 部 的 。 很 多 特定 的 分 析 都 在 循环 嵌 套 上 执行 。 已 知 最 好 的 
静态 分 析 技术 是 操作 于 整个 过 程 之 上 的 全 局 技术 。 更 大 的 作用 域 是 可 能 的 : 过 程 间 分 析 技 术 得 到 执行 过 
程 调用 对 调用 过 程 的 运行 时 环境 的 影响 的 信息 。 某 些 问 题 需 要 过 程 间 分 析 : 例如 ， 任 意 适 当 详细 的 指针 
值 分 析 必 须 扫 视 过 程 边界 。 

本 章 详细 给 出 静态 分 析 的 最 常见 形式 : 数据 流 分 析 。 编 译 器 使 用 数据 流 分 析 操 纵 优 化 和 代码 生成 。 
9.2 节 给 出 解决 数据 流 问题 的 迭代 算法 的 更 详细 论述 。 与 此 同时 ， 本 节 介 绍 编译 器 用 于 寻找 安全 且 有 效 
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机 会 的 其 他 数据 流 问 题 。9.3 节 更 加 详细 地 讨论 静态 单一 赋值 形式 ， 或 SSA 形 式 。 一 个 程序 的 SSA 形 式 以 
简单 而 直观 的 形式 编码 控制 流 和 数据 流 。 它 充当 许多 现代 转换 和 代码 生成 算法 的 基础 。 本 章 高 级 话题 一 
节 研 究 非 结构 性 的 控制 流 、 指 针 和 数组 的 使 用 以 及 程序 的 模块 分 解 等 引发 的 数据 流 分 析 中 的 问题 。 


9.2 迭代 数据 流 分 析 


在 第 8 章 ， 我 们 看 到 了 从 元 余 消 除 的 区 域 性 算法 到 需要 全 局 分 析 阶段 的 全 局 算法 的 迁移 。 编 译 器 在 
转换 任何 块 之 前 必须 计算 控制 流 图 (control-flow graph, CFG) 中 每 个 块 的 AVAIL 和 集合。 转换 的 安全 性 
取决 于 这 个 AVAIL 集 合 的 精确 性 ， 而 这 些 集合 则 取决 于 分 析 器 只 有 通过 检查 整个 过 程 才能 得 到 的 事实 。 

计算 可 用 表达 式 是 数据 流 分 析 (data-flow analysis) 的 一 种 形式 ， 即 对 运行 时 的 值 流向 进行 编译 时 
推断 。 数 据 流 分 析 就 是 求解 在 代码 的 图 形 表示 上 构建 的 方程 组 ， 它 发 现 程序 运行 时 可 能 发 生 的 事实 。 在 
优化 编译 器 中 ， 数 据 流 分 析 的 主要 用 途 是 定位 优化 机 会 ， 也 就 是 编译 器 可 以 使 用 转换 的 位 置 ， 而 且 要 证 
明 在 代码 的 某 些 点 上 使 用 转换 是 安全 的 。 

数据 流 分 析 还 用 于 帮助 程序 员 更 好 地 理解 他 们 的 程序 。 定 位 数据 落 的 不 规则 性 的 分 析 暗示 程序 中 逻 
辑 流 的 可 能 结果 所 造成 的 问题 。 其 例子 包括 未 定义 变量 的 使 用 和 从 不 被 使 用 的 变量 定义 。 任 意 条 件 的 出 
现 都 暗示 程序 可 能 出 现 逻 辑 问题 。 


9.2.1 Fee 


作为 数据 流 分 析 问 题 的 第 二 个 详细 例子 ， 考 虑 寻找 活 变 量 (live variable )。 一 个 变量 v 在 点 p 处 是 活 
的 ， 当 且 仅 当 存 在 一 个 从 p 到 v 的 使 用 的 一 个 路 径 ， 而 且 沿 着 这 一 路 径 v 不 被 重新 定义 。 编 译 器 以 多 种 方 
式 使 用 活 变 量 信 息 。 435 









静态 分 析 的 概念 直接 引出 一 个 问题 ， 那 就 是 什么 是 动态 分 析 ? 根据 定义 ， 静 态 分 析 设法 在 编译 
时 评估 运行 时 所 发 生 的 事情 。 在 很 多 情况 下 ， 编 译 器 不 能 告知 将 发 生 什么 ， 即 便 是 使 用 一 个 或 多 个 | 
运行 时 变量 时 答案 是 显然 时 也 是 如 此 。 
例如 ， 考 虑 下 面 的 C 语 言 片段 : 







X 一 y*+rz 二 12; 

*p=0; 

q=y*2 +13; 
它 包含 一 个 宛 余 表达 式 〈y*z) 当 且 仅 当 p 不 包含 y 或 z 的 地 址 。 在 编译 时 ，p 的 值 以 及 y 和 z 的 地 址 可 | 
能 是 未 知 的 。 在 运行 时 ， 它 们 是 已 知 的 且 可 被 测试 。 在 运行 时 测试 这 些 值 将 可 以 使 代码 避免 重复 计 

算 y*z， 对 此 编译 时 分 析 无 法 回答 这 一 问题 。 

然而 ， 测 试 p=&y 还 是 p=&z 还 是 二 者 都 成 立 ， 以 及 根据 测试 结果 所 做 动作 的 代价 很 可 能 超过 重复 | 
计算 y*z 的 代价 。 为 使 动态 分 析 有 意义 ， 它 必须 是 有 效 的 ， 即 节省 必须 超过 执行 分 析 的 代价 。 在 某 | 
些 情 况 下 ， 这 会 发 生 ; 而 在 大 多 数 情况 中 ， 情 况 并 非 如 此 。 相 反 ， 静 态 分 析 的 代价 可 以 被 摊派 在 可 
执行 代码 的 多 次 运行 上 ， 所 以 它 一 般 更 具有 吸引 力 。 










“ 活 变量 信息 在 全 局 寄存 器 分 配 中 扮演 着 重要 的 角色 (参见 13.5 节 )。 寄 存 器 分 配器 不 需要 把 非 活 
的 值 保 存在 寄存 器 中 ; 当 一 个 值 经 历 从 活 到 非 活 的 过 渡 时 ， 分 配器 可 以 为 其 他 目的 复 用 它 的 寄 
存 器 。 
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* 活 变量 信息 用 于 改进 SSA 结 构 ; 一 个 值 在 它 是 非 活 的 任意 块 中 都 不 需要 % 国 数 。 以 这 种 方式 使 用 活 

性 信息 可 以 大 幅度 减少 编译 器 在 构建 程序 的 SSA 形 式 时 必须 插入 的 $ 函 数 的 数量 。 

。 编 译 器 可 以 使 用 活性 信息 来 发 现 对 未 初始 化 变量 的 引用 。 如 果 某 个 变量 vy 在 通 向 这 一 过 程 的 入 口 处 

是 活 的 ， 那 么 存在 从 入口 到 v 的 使 用 一 个 路 径 ， 沿 着 这 一 路 径 v 不 被 赋值 。 如 果 v 是 一 个 局 部 变量 ， 

那么 这 一 路 径 表 示 在 v 没 有 被 赋值 时 对 v 进 行 了 引用 。 

。 最 后 ， 活 变量 信息 可 以 直接 用 于 操纵 转换 。 例 如 ， 一 个 不 再 是 活 的 值 不 需要 存 回 内 存 中 (这 是 称 

为 无 用 存储 消除 (useless-stroe elimination) 的 转换 )。 

无 论 是 源 代码 级 别 的 变量 还 是 编译 器 生成 的 临时 名 字 ， 活 性 是 变量 的 一 个 性 质 ， 而 可 用 性 是 表达 式 
的 一 个 性 质 。 因 此 ， 活 性 分 析 的 领域 与 可 用 表达 式 分 析 的 领域 是 不 同 的 。 | 

1. 活 变 最 方程 

为 了 计算 活 变 量 信 息 ， 编 译 器 可 以 使 用 一 个 集合 LIVEOUT(n) 来 注释 CFG 中 的 每 一 个 结 点 #4， 而 
LIVEOUT(n) 集合 包含 在 n 的 出 口 处 是 活 的 每 一 个 变量 的 名 字 。 这 些 集 合 由 下 面 的 方程 定义 : 


LivEOUT(ny) = 0 


LiveOut(n) = |) UEVAR(m) u (LrveOuT(m) n VARKILL(7=)) 
m € succ(n) 
KH, UEVAR(m) 包含 m 中 的 向 上 暴露 变量 ， 即 在 m 中 重新 定义 之 前 使 用 的 变量 。VARKILL(m) 包含 在 m 
中 定义 的 所 有 变量 ， 且 ny 是 CFG 的 出 口 结 点 ， 诸 如 集合 VARKILL 中 的 上 划 线 表示 这 一 集合 的 逻辑 补 。 
这 一 方程 直观 地 编码 上 述 定义 。LIVEOUT(n) 恰好 是 在 跟着 a 的 某 个 后 继 块 m 的 输入 中 活着 的 所 有 变 
量 的 全 体 。 这 一 定义 要 求 值 在 某 一 条 路 径 上 是 活 的 ， 它 不 需要 在 所 有 路 径 上 都 是 活 的 。 因 此 ，CFG 中 ”= 
的 后 继 的 贡献 组 合 在 一 起 形成 LIVEOUT(n)。n 的 特定 后 继 m 的 贡献 是 : 


UEVAR(m) U (LIVEOUT(m) NVARKILL(m)) 


变量 v 在 满足 两 个 条 件 之 一 的 情况 下 在 通 向 m 的 入 口 处 是 活 的 。 这 个 变量 在 m 中 被 重新 定义 之 前 可 能 在 m 
中 被 引用 ， 在 这 一 情况 下 vEUEVAR(m)。 它 可 能 在 m 的 出 口 处 是 活 的 ， 并 安然 无 盖 地 通过 m， 因 为 m 不 重 
新 定义 它 ， 在 这 种 情况 下 vYELIVEQUT(m) N VARKILL(n) 。 运 用 U 把 上 面 两 个 集合 合并 起 来 得 到 m 对 
LIVEOUT(n) 的 贡献 。 为 了 计算 LIVEOUT(n) ， 分 析 器 合并 所 有 "的 后 继 的 贡献 。 

为 了 计算 LIVEOUT 集 合 ， 编 译 器 可 能 使 用 下 面 三 步 又 算法 。 

1) 构建 一 个 CFG。 这 涉及 遍历 代码 的 IR 版 本 ， 发 现 基本 块 ， 并 示例 结 点 和 边 来 表示 这 些 块 以 及 它 
们 之 间 的 转换 。 图 9-1 给 出 这 一 算法 。 

2) 收集 每 个 块 的 初始 信息 。 分 析 器 一 般 必 须 遍 历 这 个 块 并 执行 某 些 简单 的 计算 。 对 于 LIVEOUT， 
这 包括 以 后 序 遍 历 每 个 块 来 计算 UEVAR 和 VARKILL。 这 一 计算 显示 在 图 9-2 的 左 栏 中 。 

3) 使 用 一 个 迭代 不 动 点 算法 在 CFG 中 传播 信息 。 在 每 个 结 点 上 ， 这 一 算法 评估 数据 流 方 程 。 当 信 
息 停 止 改变 时 ， 它 的 评估 终止 。 图 9-2 的 右 栏 给 出 这 样 一 个 算法 。 

每 一 步 又 需要 更 深层 的 解释 。 

2. AVAIL 和 LIVEOUT 之 间 的 差异 

比较 AVAIL 和 LIVEOUT 的 方程 可 以 揭示 出 二 者 之 间 的 某 些 基本 差异 。 一 个 块 的 AVAIL 集 合 依赖 于 这 
个 块 在 CFG 中 的 前 驱 ， 而 一 个 块 的 LIVEOUT 集 合 依赖 于 这 个 块 在 CFG 中 的 后 继 。 我 们 称 可 用 表达 式 为 
向 前 (forward) 问题 ， 因 为 信息 沿 着 CFG 的 边 向 前 流动 。 同 样 地 ， 活 变量 是 向 后 (backward) 问题 ， 因 
为 信息 沿 着 CFG 的 边 向 后 流动 。 
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AVAIL 方 程 使 用 求 交 运 算 合 并 不 同 路 径 的 贡献 。 因 此 ， 一 个 表达 式 在 n 的 人口 处 可 用 当 且 仅 当 它 沿 


通 向 mn 的 所 有 路 径 都 可 用 。LIVEOUT 集 合 的 计算 使 用 并 运算 合并 不 同 路 径 的 贡献 。 


因此 ， 沿 着 从 块 nm 出 


去 的 任意 路 径 的 活 变量 在 的 出 口 也 是 活 的 。 数 据 流 问 题 有 时 被 刻画 成 任意 路 径 问 题 或 所 有 路 径 问 题 。 


next + 1 
Leader/next++] + 1 
fori- Iton 
if op; has a label |; then 
Leaderfnext++] + i 


create a CFG node forl; 


寻找 前 导 


fori I tonext-1 


j + Leader/i] + 7 

while (j < n and op; ¢ Leader) 
jej+! 

jej-1 

Last/i] + j 

if op; is “cbr ro11,12" then 
add edge from j j to node for 1, 
add edge from j to node for 1, 

else if op; is “jumpI—1,” then 
add edge from j to node for 1, 


else if op; is “jump—ry " then 
add edges from j to all other nodes 


寻找 块 结束 并 添加 边 


， 支 指定 所 有 输出 的 标签 : 








.图 9-1 构建 控制 流 图 


3. 构建 控制 流 图 

在 最 简单 的 情况 下 ，CFG 确 定 每 一 个 基本 块 的 开始 端 和 尾 端 ， 并 用 描述 块 之 间 可 能 的 控制 转换 的 边 
把 结果 块 连结 起 来 。 最 初 ， 假 设 CFG 构 建 器 作为 输入 得 到 一 个 表示 典型 类 Algol 语 言 中 的 简单 、 线 性 的 
IR。 在 本 节 的 末尾 ， 我 们 主要 揭示 在 CFG 的 构建 中 引发 的 某 些 复杂 性 问题 。 

开始 ， 编 译 器 必须 找到 每 一 个 基本 块 的 开始 端 和 尾 端 。 在 线性 了 中 ， 一 个 块 的 初始 操作 有 时 称 为 一 
个 前 导 (leader)。 一 个 操作 是 前 导 ， 如 果 它 是 这 一 过 程 中 的 第 一 个 操作 ， 或 者 它 有 可 以 成 为 分 支 目标 的 
标签 。 编 译 器 可 以 在 对 IR 的 一 次 遍历 中 识别 所 有 的 前 导 ， 如 图 9-1 的 左边 所 示 。 它 在 程序 中 的 操作 上 依 
次 进行 选 代 ， 发 现 带 标签 语句 ， 并 把 它们 记录 为 前 导 。S . 

” 第 二 次 遍历 寻找 结束 一 个 块 的 每 个 操作 。 它 假设 每 个 块 都 结束 于 一 个 分 支 或 跳 转 ， 而 且 假设 那些 分 
“发 生 分 支 标签 ”和 “不 发 生 分 支 标签 "。 这 简化 块 处 理 并 使 编译 器 后 端 来 选择 
分 支 的 “落下 ”情况 的 路 径 。( 目前 ， 我 们 假设 分 支 没有 等 待 槽 。) 

为 了 找到 每 个 块 的 尾 端 ， 这 一 算法 以 各 块 在 前 导数 组 的 出 现 顺 序 迭 代 各 块 。 它 向 前 遍历 IR ， 直 到 找 
到 后 继 块 的 前 导 。 那 个 前 导 的 前 一 个 操作 结束 当前 块 。 算 法 把 该 操作 的 索引 记录 在 Last{ 让 中 ， 这 样 序 对 
<leader[i], ，last[i]> 描 述 块 i。 它 把 所 需 的 边 加 入 CFG 中 。 

正如 我 们 在 第 5 章 所 做 的 假设 那样 ，CFG 应 该 有 惟一 的 入 口 结 点 mw 和 惟一 的 出 口 结 点 n:。 代 码 应 该 有 
这 样 的 形态 。 如 果 它 没有 这 样 的 形态 ， 这 个 图 的 一 个 简单 的 后 序 遍 历 可 以 创建 no 和 nny。 

4. CFG 构 建 中 的 复杂 性 | 

IR 的 性 质 、 目 标 体系 结构 ， 甚 至 是 源 语 言 都 可 能 使 CFG 的 构建 过 程 复杂 化 。 例 如 ，ILOC 的 jump 操 
作 这 样 的 歧义 性 跳 转 可 能 迫使 编译 器 把 来 自 跳 转 的 边 加 到 过 程 中 的 每 一 个 带 标 签 的 块 。 这 可 能 把 运行 时 
从 不 出 现 的 边 加 到 CFG 中 ， 从 而 降低 编译 器 得 到 的 数据 流 信息 的 质量 并 减弱 优化 的 效果 。 在 目标 已 知 的 


日 ”如 果 代 码 包含 不 作为 分 支 且 标的 标签 ， 那 么 这 可 能 不 必要 地 划分 块 。 一 个 更 复杂 的 算法 可 能 只 把 分 支 和 跳 
转 的 目标 加 入 前 导 和 集合 中 。 如 果 代 码 包 含 任意 歧义 性 跳 转 ， 即 一 个 到 寄存 器 中 的 地 址 的 跳 转 ， 那么 它 无 论 
如 何必 须 把 所 有 带 标签 语句 作为 前 导 。 


A 
w 
oo 
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情况 下 ， 编 译 器 设计 者 一 般 应 该 避免 生成 歧义 性 跳 转 ， 即 使 在 IR 生 成 期 间 这 要 求 额外 的 分 析 。 本 书 的 
ILOC 示 例 避 开 使 用 跳 转 到 寄存 器 操作 junmp ， 而 使 用 立即 跳 转 JumpI。 

编译 器 设计 者 可 以 通过 在 IR 中 包含 记录 可 能 的 跳 转 目标 在 一 定 程度 上 改进 这 一 状况 。ILOC 引 入 tb1 
伪 操 作 来 让 编译 器 记录 歧义 性 跳 转 的 可 能 目标 。 每 当 编译 器 生成 一 个 jump ， 它 都 应 该 使 用 记录 这 一 跳 转 
的 可 能 目标 的 tb1 一 组 操作 跟踪 这 一 分 支 。 当 编译 器 构建 CFG 时 ， 它 可 以 使 用 这 些 线索 限制 假 边 的 数量 。 
跟 在 一 组 tbl 后 面 的 任意 jump 得 到 在 这 些 tbl 操 作 中 命名 的 每 个 块 的 边 。 没 有 tb1 的 任意 jump 生 成 到 每 个 
带 标签 块 的 边 。 

在 编译 的 后 期 阶段 ， 编 译 器 也 许 需要 根据 目标 机 器 代码 构建 CFG。 在 这 一 点 ， 目 标的 体系 结构 可 能 
使 这 一 过 程 复杂 化 。 图 9-1 中 的 算法 假设 除了 第 一 个 前 导 外 ， 所 有 的 前 导 都 带 标签 。 如 果 目 标 机 器 有 藻 
下 分 支 ， 那 么 必须 扩展 这 一 算法 以 识别 在 落下 路 径 上 接受 控制 的 不 带 标签 语句 。 如 果 代 码 已 经 完成 调度 
并 且 它 模型 化 分 支 等 待 槽 ， 那 么 问题 就 变 得 更 困难 。 位 于 分 支 等 待 档 中 的 带 标签 语句 是 两 个 不 同 块 的 成 
员 。 编 译 器 可 以 通过 复制 改变 这 一 情况 ， 创 建 这 一 等 待 档 中 的 操作 的 新 〈 不 带 标签 ) 拷贝 。 

等 待 模 还 使 寻找 块 尾 端 的 过 程 复杂 化 。 如 果 一 个 分 支 或 跳 转 在 分 支 等 待 档 中 出 现 ， 那 么 GCF 构 建 器 
必须 从 这 个 前 导 开始 向 前 遍历 来 寻找 块 结束 分 支 ， 也 就 是 它 遇 到 的 第 一 个 分 支 。 一 个 块 结束 分 支 的 等 待 
村 中 的 分 支 自身 ， 可 能 在 通 向 目标 块 的 入口 处 是 未 决 的 。 它 们 可 能 分 离 目标 块 并 迫使 创建 新 块 和 新 边 。 
在 这 些 环境 下 创建 CFG 所 需要 的 分 析 更 加 复杂 。 | 

某 些 语言 ， 例 如 Pascal 和 Algol， 人 允许 跳 转 到 当前 过 程 外 面 的 标签 。 可 以 使 用 一 个 到 为 表示 目标 而 创 
建 的 CFG 结 点 的 分 支 在 当前 过 程 中 建 模 这 一 转换 。 这 一 复杂 性 也 出 现在 这 一 分 支 的 另 一 端 ， 在 此 从 一 个 
未 知 源头 的 转换 能 到 达 一 个 块 。 出 于 这 种 原因 ， 非 轨 辑 转向 通常 被 限定 于 一 个 词法 代 套 过 程 中 ， 在 那里 
编译 器 可 以 一 次 查看 所 有 相关 过 程 的 CFG。 在 这 种 情况 下 ， 编 译 器 可 以 插入 所 需要 的 边 并 正确 地 建 模 这 
些 效应 。 


5. 收集 初始 信息 

对 于 LIVEOUT, 分 析 器 必须 为 每 个 块 计算 UEVAR 和 VARKILL 集 合 。 一 次 遍历 可 以 同时 计算 这 两 项 。 
对 于 每 个 块 ， 分 析 器 将 这 些 集合 初始 化 为 空 集 。 接 着 ， 分 析 器 按 从 上 到 下 的 顺序 遍历 这 个 块 并 更 新 
UEVAR 和 VARKILL 来 反映 每 一 个 操作 的 影响 。 图 9-2 的 左边 给 出 这 一 计算 的 详细 过 程 。 


for i — 1 to number of operations 
assume op; is “x + y op 2” N + number of blocks —1 
if i € Leader then fori — Oto N 
b +- block number for i LIVEOUT(i) + 0 
UEVAR(D) + 6 changed 
ged + true 
VaRKILL(b) + 0 while (changed) 


ify ¢ VARKILL(b) then changed + false 

_UEVaR(b) +- UEVAR(b) U {y} fori —OtoN 

if z ¢ VaRKiLL(b) then recompute LIVEOUT(i) 
UEVaR(b) +- UEVAR(D) U {z} if LrveOut(i) changed then 

VARKILL(b) «+ VARKILL(D) U {x} changed +- true 


收集 初始 信息 解 方程 





图 9-2 迭代 活 分 析 


这 一 过 程 比 AVAIL 计 算 的 相应 部 分 简单 ， 因 为 LIVYVEOUT 使 用 VARKILL 而 不 是 EXPRKILL。 从 
VARKILL 计 算 EXPRKILL 显 著 地 增加 AVAIL 计 算 中 的 局 部 分 析 代 价 。( 参 见 图 8-8 的 比较 )。 
考虑 如 图 9-3 所 示 的 代码 片段 。 它 由 包含 嵌 套 if-then-e1se 结 构 的 一 个 循环 组 成 。 这 一 代码 中 的 很 多 
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细节 已 被 抽出 。 为 了 计算 LIVEOUT 和 集合 ， 编 译 器 应 该 首先 构造 CFG 并 计算 每 个 块 的 UEVAR 和 VARKILL 
(YARKILL 的 补 集 )。 通 过 观察 ， 我 们 可 以 看 到 它 将 生成 下 面 的 集合 : 





BB Be 







a,b,c 
UEVAR 0 0 0 0 0 0 0 ee 


Cub} Ct} E Ce) Oe) OSES) Ce 


因为 我 们 已 省 略 了 大 部 分 操作 的 右 部 ， 所 以 UEVAR 集 合 异 常 稀疏 的 。 利 用 这 些 细节 的 话 ， 大 部 分 
块 的 UEVAR 集 合 将 是 非 空 的 。 


6. 求解 LIVEOUT 方 程 

为 了 求 LIVEOUT 和 集合 的 值 ， 编 译 器 设计 者 可 以 改编 图 8-9 的 迭代 算法 。 可 以 使 用 LIVEOUT 的 等 价 代 
码 取代 AVAIL 特 化 代码 ; 其 结果 的 迭代 算法 如 早 前 的 算法 一 样 计算 一 个 不 动 点 。 

图 9-2 右 侧 给 出 求解 LIVEOUT 方 程 的 一 个 迭代 方案 。 它 把 所 有 的 LIVEOUT 和 集合 初始 化 为 空 集 。 接着 ， 
它 按 Bo 到 B; 的 顺序 计算 每 个 块 的 LIVEOUT 和 集合 。 它 反复 计算 LIVEOUT 和 集合 ， 直 到 它们 停止 变化 。 这 产 
生 如 下 的 LIVEOUT 和 集合 中 的 值 。 第 一 行 是 初始 值 。 : 
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{i} {ai} { 
{i} {a,c, i} fae 
{i} {ascot} {BY 






第 1 次 迭代 为 每 个 块 构造 空 的 LIVEOUT 集 合 ，B; 的 前 驱除 外 。( 只 有 B7 有 非 空 的 UEVAR 集 合 。) 
计算 
UEVAR(B7) U (LIVEOUT(B7) N VARKILL(B7)) 


PERS la, b, c, d, i}. LIVEOUT(B,) 和 LIVEOUT(B6) 二 者 都 在 第 1 次 迭代 的 尾部 有 这 个 值 。 第 2 次 
迭代 填充 更 多 的 LIVEOUT 集 合 。 根 据 8,，LIVEOUT(B) 得 到 {fa，i}。LIVEOUT(B,) 和 LIVEOUT(B,) 从 
Be 都 得 到 {a，c，d} 最 后 ，LIVEOUT(B,) 从 B, 得 到 {i}; 计算 使 用 LIVEOUT(B,) 的 最 近 的 值 。 

第 3 次 迭代 把 {让} 传播 到 LIVEOUT(B0) 中 。LIVEOUT(B,) 得 到 {a,，c，d，i}。 边 <B;，Bs> 贡 献 出 {a,c， 
i}， 而 边 <B3;，Bs> 添 加 {a，d，i}。 因 此 ，LIVEOUT(B,) SLIVEOUT(B,) 和 LIVEOUT(B,) 是 相等 的 ， 而 B， 
和 Bs 都 只 传递 它们 自己 的 LIVEOUT 集 合 的 一 个 子 集 。 

第 4 次 和 迭代 从 边 <B,，Ba> 把 {c} 加 到 LIVEOUT(B,) 中 。 最 后 ， 第 5 次 迭代 重新 计算 所 有 的 LIVEOUT 集 
合 但 不 改变 其 中 的 任意 一 个 ， 所 以 这 一 分 析 器 从 whi1e 循 环 跳出 并 停止 。 


9.2.2 迭代 LIVEOUT 解 算 器 的 性 质 


与 LIVEOUT 计 算 类 似 ， 数 据 流 分 析 构 成 标量 优化 编译 器 的 分 析 上 骨架。 已 经 开发 出 很 多 解决 数据 流 
问题 的 技术 。 我 们 集中 精力 讨论 迭代 算法 ， 因 为 这 样 的 算法 具有 高 速 和 稳健 的 行为 ， 还 因为 我 们 对 它 的 
基础 理论 已 经 有 深入 的 理解 。 本 节 概 述 LIVEOUT 的 迭代 解 算 器 (solver) 的 三 个 重要 问题 的 解答 : 

1) 分 析 终 止 吗 ? 

2) 分 析 计 算 什么 答案 ? 

“3) 分 析 有 多 快 ? 

编译 器 设计 者 在 设计 分 析 遍 时 都 应 该 考虑 这 三 个 问题 。 

1. 终止 性 

和 迭代 的 活 变量 分 析 终止 ， 因 为 集合 在 整个 计算 中 单调 增长 。 算 法 初始 化 每 个 LIVEOUT 集 合 为 空 集 。 
对 while 循 环 的 仔细 推断 表明 LIVEOUT 和 集合 可 以 变 得 更 大 ,但 从 不 减 小。 任意 LIVEOUT 集 合 的 大 小 由 
变量 数 |V| 界 定 。 在 图 9-3 的 例子 中 ，V 是 {a,，b，c，d，i，y，Zzj} 而 且 每 一 个 LIVEOUT 和 集合 或 者 是 V 或 者 
是 V 的 某 个 真子 集 。 

因为 |Y| 是 有 界 的 ， 算法 计算 的 LIVEOUT 集 合 序列 也 是 有 界 的 。 因此 ， 迭 代 最 后 一 定 停止 。 当 它 停 
止 时 ， 解 算 器 找到 LIVEOUT 计 算 的 这 一 特殊 实例 的 不 动 点 。 

2. 正确 性 

回想 一 下 活 变 量 的 定义 : 一 个 变量 v 在 点 p 处 是 活 的 ， 当 且 仅 当 存在 一 条 从 p 到 v 的 使 用 的 路 径 ， 沿 着 
这 一 路 径 v 不 被 再 定义 。 活 性 是 根据 图 中 的 路 径 定义 的 。 一 定 存在 不 包含 v 的 定义 的 从 p 到 v 的 使 用 的 路 径 ， 
我 们 称 这 条 路 径 为 v 有 效 路 径 。. 
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LIVEOUT(n) 包含 "， 当 且 仅 当 v 在 块 n 的 尾部 是 活 的 。 为 了 构成 LIVEOUT(n)， 算 法 计算 在 CFG 中 的 
n 的 每 一 个 后 继 对 LIVEOUT(n) 的 贡献 。 它 使 用 并 集结 合 这 些 贡 献 ， 因 为 
vELIVEOUT(n), 仅 当 v 在 任意 离开 n 的 路 径 上 是 活 的 。 各 个 边 上 的 局 部 计算 是 如 何 与 (4) 


所 有 路 径 上 定义 的 活性 相关 联 的 呢 ? 
由 这 一 迭代 算法 计算 而 来 的 LIVEOUT 集 合 构成 这 些 方程 的 一 个 不 动 点 解 。 超出 《24 O 


本 节 范 围 的 迭代 的 数据 流 分 析 理 论 向 我 们 保证 对 于 这 些 特殊 方程 存在 一 个 不 动 点 ， T 
而 且 这 一 不 动 点 是 惟一 的 [199]。 定 义 的 所 有 路 径 解 也 是 这 些 方程 的 不 动 点 ， 称 为 在 
所 有 路 径 相 遇 解 (meet-over-all-paths-solution ) 。 不 动 点 的 惟一 性 确保 由 迭 代 算 法 计 后 序 图 


算 而 来 的 集合 与 所 有 路 径 相 遇 解 相同 。 


3. 高 效 性 

特定 过 程 的 LIVEOUT 方 程 的 不 动 点 解 与 解 算 器 计算 各 个 集合 的 顺序 无 关 ， 这 是 惟 
一 性 的 一 个 结果 。 因 此 ， 编 译 器 设计 者 可 以 自由 地 选择 改进 分 析 器 运行 时 间 的 顺序 。 

图 的 逆 后 序 遍 历 (reverse postorder, RPO) 对 迭 代 算 法 来 说 是 特别 高 效 的 。 后 
序 遍 历 在 访问 一 个 结 点 之 前 以 一 致 顺序 尽 可 能 多 地 访问 该 结 点 的 子 结 点 。( 在 循环 图 
中 ， 一 个 结 点 的 子 结 点 也 可 能 是 它 的 祖先 ) RPO 遍 历 恰好 相反 ， 在 访问 一 个 结 点 之 
前 ， 它 尽 可 能 多 地 访问 这 个 结 点 的 前 驱 。 一 个 结 点 的 RPO 编 号 是 n + 1 减 去 它 的 后 序 
数 ， 其 中 n 是 图 中 结 点 的 数量 。 f 





N + number of blocks —1 

fori + Oto N 
LIVEOUT(i) + 0 

changed + true 

while (changed) 


changed +- false 
fori + 1 toN 
j + Reverse Preorder[i] 
LIVEOUT( j) = ke Siei) fy 1 (LIVEOUT(K)) 
if LIVEOUT( j) has changed then 
changed + true 





图 9-4 LIVEOUT 的 Round-Robin 后 序 解 算 器 


对 于 诸如 AVAIL 这 样 的 向 前 问题 ， 迭 代 算 法 应 该 使 用 在 CFG 上 计算 的 RPO。 而 对 诸如 LIVEOUT 这 样 
的 向 后 数据 流 问题 ， 迭 代 算 法 应 该 使 用 在 逆向 CFG 上 计算 的 RPO。( 逆向 CFG 就 是 把 边 逆 置 了 的 CFG， 
所 以 ny 是 它 的 入 口 结 点 而 mo 是 它 的 出 口 结 点 。) 逆向 CFG 的 RPO 等 价 于 原来 的 CFG 上 的 逆 前 序 。 

如 果 和 迭代 算法 使 用 适当 的 RPO 遍 历 ， 它 通常 能 够 避 开 初始 化 某 些 集合 的 需要 。 例 如 ， 在 活性 分 析 中 ， 
初始 化 LIVEOUT(ny) 为 空 集 就 足够 了 。 在 CFG 的 逆 后 序 遍 历 中 ， 对 于 每 一 个 结 点 在 这 个 结 点 的 逆 前 序 后 
继 处 的 LIVEOUT 和 集合 计算 仅 使 用 这 个 结 点 的 LIVEOUT 集 合 的 值 ， 而 解 算 器 将 在 此 计算 之 前 计算 这 个 结 
点 的 LIVEOUT 集 合 ， 只 及 除外 。 

为 了 查看 顺序 的 影响 ， 考 虑 图 9-3 的 LIVEOUT 计 算 上 的 RPO 遍 历 的 影响 。 逆 向 CFG 的 一 个 RPO 编 
号 是 : 
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这 一 算法 在 三 次 迭代 后 停止 ， 而 由 块 编号 严格 规定 的 遍历 需要 五 次 迭代 。 比 较 这 个 表 和 早 前 的 计算 ,我 
们 就 可 以 看 到 为 什么 会 有 这 样 的 结果 。 在 第 一 次 迭代 时 ， 算 法 计算 除 B; 之 外 所 有 结 点 的 正确 LIVEOUT 
集合 。 算 法 需要 在 第 二 次 迭代 计算 B 的 LIVEOUT 集 合 ， 这 是 因为 后 边 ， 即 从 B 到 有 的 边 的 存在 。 算 法 需 
要 第 三 次 迭代 来 识别 这 一 算法 已 达到 它 的 不 动 点 。 


9.2.3 ”数据 流 分 析 的 局 限 性 


编译 器 能 够 从 数据 流 分 析 中 了 解 的 信息 存在 一 定 的 局 限 。 在 某 些 情况 下 ， 这 些 局 限 来 自 于 对 分 析 所 
做 的 假设 。 而 在 另外 一 些 情况 下 ， 这 些 局 限 来 自 于 被 分 析 语 言 的 性 质 。 为 了 做 出 可 靠 的 决定 ， 编 译 器 设 
计 者 必须 了 解数 据 流 分 析 能 做 什么 以 及 它 不 能 做 什么 。 

当 和 迭代 算 法 计算 CFG 中 的 结 点 n 的 LIVEOUT 集 合 时 ， 它 使 用 集合 LIVEOUT、UEVAR 以 及 n 在 CFG 中 
的 所 有 后 继 的 VARKILL 集 合 。 这 隐 含 假设 执行 可 以 达到 所 有 这 些 后 继 ; 在 实践 中 ,这些 后 继 中 的 一 个 
或 多 个 可 能 是 不 能 达到 的 。 考 虑 图 9-5 所 示 的 代码 片段 ， 以 及 它 的 CFG。 

Bo 中 对 x 的 赋值 是 活 的 ， 因 为 x 在 B1 中 使 用 。B, 中 对 x 的 赋值 杀 死 这 个 值 。 如 果 B, 从 不 执行 ， 那 么 x 在 
B6 中 的 值 在 与 y 的 比较 后 不 是 活 的 ， 且 XFLIVEOUT(B0)。 如 果 编 译 器 能 够 证 明 测试 (y<x) 总 是 假 的 ， 
那么 控制 将 从 不 转移 到 块 B1 且 从 不 执行 对 z 的 赋值 。 如 果 对 f 的 调用 没有 副作用 ， 那 么 整个 语句 是 无 用 的 
且 无 需 执行 。 因 为 测试 的 结果 是 已 知 的 ， 编 译 器 可 以 完全 消除 块 B 和 B。 


x €f(17) 
if (y < x) then 
zex+3 


x +0 





图 9-5 控制 流 限制 数据 流 分 析 的 精确 性 
然而 ，LIVEOUT 的 方程 取 这 一 块 的 所 有 后 继 的 并 集 。 因 此 ， 分 析 器 计算 LIVEOUT(B。) 为 : 
UEVAR(B1) U (LIVEOUT(B1) N VARKILL(Bi)) U 
UEVaR(B2) U (LIVEOUT(Bz) N VARKILL(B2)) 
所 有 数据 流 分 析 技术 都 假设 CFG 的 所 有 路 径 实际 上 都 可 能 被 采用 。 因 此 ， 这 些 数据 流 分 析 技 术 计 算 的 信 


息 总 括 可 能 的 数据 流 事 件 ， 假 设 每 一 条 路 径 都 可 被 采用 。 这 限制 了 结果 信息 的 精确 度 ;我 们 说 这 一 信息 
精确 到 “符号 执行 ”。 使 用 这 一 假设 ，x 在 Bo 的 出 口 是 活 的 ， 而 Bo 和 Bi, 必须 被 保存 。 
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信息 的 非 精确 性 玖 及 数据 流 的 分 析 结 果 的 另外 一 种 方式 来 自 于 对 数组 、 指 针 和 过 程 调 用 的 处 理 。 诸 
如 ALi，j ,kj 这 样 的 数组 引用 将 引用 A 的 一 个 元 素 。 然 而 ， 在 没有 揭示 i、j 和 Kk 的 值 的 分 析 时 ， 编 译 器 不 
能 告知 存 取 的 是 哪 一 个 元 素 。 出 于 这 一 原因 ， 编 译 器 传统 上 把 所 有 对 数组 A 的 引用 结合 到 一 起 。 因 此 数 
组 A[x，y，z] 的 使 用 被 看 成 是 A 的 使 用 ， 而 ALc，d，e] 的 定义 被 看 成 是 A 的 定义 。 

然而 ， 要 注意 尽 可 能 避免 做 过 强 的 推断 。 编 译 器 知道 它 关 于 数组 的 信息 不 够 精确 ， 所 以 它 必须 保守 
地 解释 这 一 信息 。 因 此 ， 如 果 分 析 的 目标 是 确定 一 个 值 在 哪里 不 再 是 活 的 〈 也 就 是 ， 这 个 值 一 定 已 经 被 
杀 死 )， 那 么 AL1，j，k] 的 定义 不 杀 死 A 的 值 。 如 果 分 析 的 目标 是 识别 一 个 值 也 许 不 再 存活 的 位 置 ， 那 么 
A[i，j，k] 的 定义 可 能 重新 定义 A 的 任意 元 素 。 


数据 流 方程 中 的 集合 命名 | 
在 书写 经 典 间 题 的 数据 流 方程 时 ， 我 们 对 许多 包含 局 部 信息 的 集合 进行 了 重新 命名 。 原 始 论文 


使 用 更 直观 的 集合 名 字 。 遗 憾 的 是 ， 在 处 理 这 一 问题 时 这 些 名 字 之 间 会 发 生 冲 突 。 例 如 ， 可 用 表达 
式 、 活 变量 、 可 达 定 义 以 及 忙碌 表达 式 都 使 用 KILL 集 合 的 概念 。 然 而 ， 这 四 个 问题 定义 在 三 个 不 同 


的 定义 域 上 : 表达 式 (AVAIL 和 VERYBUST)、 定 义 点 (REACHAES) 以 及 变量 (LIVEOUT)。 因 


此 ， 使 用 KILL 或 KILLED 导 致 某 些 问题 上 的 混乱 。 

我 们 使 用 的 名 字 既 编码 定义 域 又 编码 有 关 和 集合 意义 的 线索 。 因 此 ，VARKILL(n) 包含 在 块 a 中 被 
杀 死 的 所 有 变量 集合 ， 而 EXPRKILL(n) 包含 在 块 4 中 被 杀 死 的 所 有 表达 式 。 同 样 地 ，UEVAR(n) 包 
含 在 块 x 中 向 上 暴露 的 所 有 变量 ， 而 UEEXPR(n) 包含 向 上 暴露 的 所 有 表达 式 的 集合 。 尽 管 这些 名 字 
有 时 候 很 难看 ， 但 它们 却 能 鲜明 地 区 分 出 用 于 可 用 表达 式 中 的 杀 死 概念 和 用 于 可 达 定 义 中 的 杀 死 
(DEFKILL ) 概念 之 间 的 差异 。 


指针 给 静态 分 析 的 结果 带 来 另外 一 层 不 精确 性 。 指 针 上 的 显 式 算 术 把 情况 搞 得 更 精 。 没 有 跟踪 指针 
值 的 特殊 分 析 ， 编 译 器 必须 把 对 基于 指针 的 变量 的 赋值 解释 为 这 一 指针 可 能 达到 的 每 一 个 变量 的 可 能 定 
义 。 类 型 的 安全 性 可 能 限制 能 够 通过 指针 的 赋值 定义 的 对 象 集合 ; 一 个 指向 类 型 的 指针 只 用 于 修改 类 
型 的 对 象 。 没 有 指针 值 的 分 析 或 类 型 安全 性 的 保证 ， 给 一 个 基于 指针 的 变量 的 赋值 可 能 追 使 分 析 器 假 
设 每 一 个 变量 都 被 修改 了 。 在 实践 中 ， 这 通常 阻止 编译 器 在 任意 基于 指针 的 赋值 间 把 基于 指针 的 变量 的 
值 保存 在 寄存 器 中 。 除 非 编译 器 可 以 特别 地 证 明 用 于 这 一 赋值 中 的 指针 不 可 能 指向 对 应 于 寄存 器 中 的 值 
的 内 存 位 置 ， 这 是 惟一 的 安全 通道 。 

在 实践 中 ， 指 针 分 析 的 复杂 性 阻止 很 多 编译 器 使 用 寄存 器 来 保存 基于 指针 的 变量 的 值 。 有 些 变量 通 
常 被 免除 这 种 处 理 ， 例 如 地 址 从 不 被 使 用 的 局 部 变量 就 是 这 样 的 变量 。 另 一 种 选择 是 执行 以 基于 指针 引 
用 中 的 歧义 性 消除 为 目的 的 数据 流 分 析 : 缩小 在 代码 中 每 一 点 处 指针 可 能 引用 的 可 能 变量 集合 。 

过 程 调用 是 不 精确 信息 的 最 后 一 个 源头 。 为 了 精确 地 建 模 当 前 过 程 中 的 数据 流 ， 编 译 器 必须 详细 地 
了 解 被 调用 过 程 对 当前 过 程 和 被 调用 过 程 都 可 存 取 的 每 一 个 变量 所 做 的 事情 。 而 且 ， 被 调用 过 程 可 能 调 
用 其 他 过 程 。 当 然 ， 这 些 过 程 将 有 自己 的 潜在 影响 。 

除非 编译 器 拥有 总 括 程 序 中 所 有 过 程 的 效应 的 精确 信息 ， 否 则 它 必须 估 测 这 些 过 程 在 最 坏 情况 下 的 
行为 。 尽 管 特定 的 假设 因 问 题 的 不 同 而 不 同 ， 但 是 一 般 的 假设 是 被 调用 过 程 将 引用 并 修改 它 能 寻 址 的 每 
一 个 变量 ， 而 且 引 用 调用 参数 生成 歧义 性 引用 。 因 为 很 少 有 过 程 真 的 有 这 样 的 行为 方式 ， 所 以 这 种 假设 
通常 过 高 估计 过 程 调用 的 影响 。 这 将 进一步 使 数据 流 分 析 结 果 不 精确 。 
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9.2.4 数据 流 分 析 的 其 他 问题 


编译 器 使 用 数据 流 分 析 证 明 特殊 情况 下 的 转换 的 安全 性 。 因 此 ， 已 经 有 很 多 不 同 的 数据 流 问题 被 提 
出 ， 每 一 个 问题 都 推动 特殊 的 优化 。 

1. 可 用 表达 式 

第 8 章 介绍 了 在 代码 中 每 一 点 发 现 可 用 表达 式 集 合 的 问题 。 可 用 表达 式 被 公式 化 为 以 在 程序 内 计算 
的 表达 式 为 定义 域 的 向 前 数据 流 问题 。 其 结果 的 AVAIL 集 合用 于 驱动 全 局 公共 子 表达 式 的 消除 。 

2. 可 达 定 义 

在 某 些 情况 下 ， 编 译 器 需要 知道 给 定 操作 的 操作 数 的 定义 位 置 。 如 果 在 CFG 中 有 多 条 路 径 导 向 这 一 
操作 ， 那 么 多 个 定义 可 以 提供 这 一 操作 数 的 值 。 为 了 寻找 到 达到 一 个 块 的 定义 集合 ， 编 译 器 可 以 计算 可 
达 定 义 〈reaching definition)。REACHES 的 定义 域 是 过 程 中 定义 地 点 的 集合 。 某 个 变量 v 的 一 个 定义 d 达 
到 操作 i， 当 且 仅 当 i 读 取 v 的 值 且 存在 从 4 到 i 的 v 有 效 路 径 。 

编译 器 使 用 集合 REACHES(n) 注释 CFG 中 的 每 一 个 结 点 n， 该 集合 被 计算 为 如 下 所 示 的 向 前 数据 流 
问题 : 


REACHES(no) = 0 


REACHES(n) = |] (DEDEF(m) U (REACHES(m) n DEFKILL(7))) 
m € preds(n) 

DEDEF(m) 是 m 中 向 下 烘 露 的 定义 集合 ， 即 m 中 的 这 些 定义 所 定义 的 名 字 在 m 中 不 再 重新 定义 。 
DEFKILL(m) 包含 m 中 相同 名 字 的 定义 所 隐藏 的 所 有 定义 点 ， 即 dEDEFKILL(z) 如 果 d 定 义 某 个 名 字 v 且 
m 包 含 同样 定义 v 的 定义 。 因 此 ， DEFKILL(m) 即 DEFKILL(m) 的 补 集 由 在 中 不 被 隐藏 的 定义 点 组 成 。 

DEDEF 和 DEFKILL 二 者 都 定义 在 定义 点 的 集合 上 ， 但 是 计算 其 中 任意 -一 个 都 需要 一 个 从 名 字 〈 变 
量 名 字 和 编译 器 生成 的 临时 变量 名 字 ) 到 定义 点 的 映射 。 因此， 收集 可 达 定 义 的 初始 信息 比 收集 活 变量 
的 初始 信息 更 复杂 。 

3. 忙碌 表达 式 

一 个 表达 式 e 被 认为 在 一 个 块 4 的 出 口 性 碌 (very busy)， 如 果 e 在 离开 n 的 每 一 条 路 径 上 被 评估 且 被 
使 用 ， 而 且 在 "的 尾部 评估 e 产 生 的 结果 与 沿 着 离开 "的 每 一 条 路 径 对 的 首次 评估 的 结果 相同 。 忙碌 分 析 
是 表达 式 定义 域 上 的 一 个 向 后 数据 流 问题 : 


VERYBUSY(ny) = 0 


VeryBusy(n) = | (UEEXPR(m) U (VBRYBUSY(m) — EXPRKILL(m))) 
m € suce(n) . 
这 里 ，UEEXPR(m) 是 向 上 和 暴露 的 表达 式 集合 ， 即 那些 在 被 杀 死 前 在 m 中 使 用 的 表达 式 的 集合 。 
EXPRKILL(m) 是 在 m 中 定义 的 表达 式 的 集合 这 与 出 现在 可 用 表达 式 方程 的 集合 是 相同 的 。 

编译 器 可 以 使 用 这 一 分 析 的 结果 定位 代码 提升 (code hoisting) 的 机 会 。 如 果 e 在 p 处 忙碌 ， 那 么 编 
译 器 可 以 在 p 处 插入 一 个 e 的 评估 ， 并 删除 离开 p 的 每 一 条 路 径 上 的 第 一 个 e 的 评估 。 这 一 转换 不 缩短 路 径 ， 
但 是 减 小 整个 程序 中 的 操作 数量 。 因 此 ， 它 减 小 代码 空间 。 
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| 实现 数据 流 框架 | 
很 多 全 局 数据 流 问题 的 方程 显示 出 令 人 惊讶 的 相似 性 。 例 如 ， 可 用 表达 式 、 活 变量 、 可 达 定义 | 
以 及 忙碌 表达 式 都 有 如 下 形式 的 传播 函数 


F(x) = ci op; (x op, c2) | 
其 中 ，ci 和 c 是 由 实际 代码 所 确定 的 常量 ， 且 opi 和 op, 是 诸如 U 、n 和 等 标准 集合 操作 。 这 一 相似 | 


性 在 这 些 问 题 有 快速 的 选 代数 据 流 框架 的 证 明 中 显示 出 威力 。 这 些 相似 性 还 应 该 在 它们 的 实现 中 显 | 


示 出 威力 。 
编译 器 设计 者 可 以 容易 地 提取 这 些 问题 的 不 同 细节 并 实现 单一 的 参数 化 分 析 器 。 这 一 分 析 器 需 | 
要 计算 c, 和 c; 的 函数 ， 操 作 符 的 实现 以 及 问题 的 方向 指示 。 反 之 ， 它 产生 理想 的 数据 流 信息 。 
这 一 实现 策略 激励 代码 复 用 。 它 隐藏 解 算 器 的 低级 细节 。 同 时 ， 它 创建 编译 器 设计 者 可 以 对 优 
| 化 实现 进行 有 效 投资 的 环境 。 例 如 ， 人 允许 这 一 框架 实现 f(x) =a op,(x op, b) 为 单一 函数 的 方案 可 能 
| 胜 过 使 用 有 (x) =a op, x 和 (Xx) =x op, b 并 把 fx) HRANO 的 实现 。 这 一 方案 使 得 所 有 客户 转换 | 
| 都 受益 于 优化 集合 表示 和 操作 符 实现 。 





4. 常量 传播 

如 果 编 译 器 可 以 证 明 某 个 变量 v 在 代码 的 p 点 处 总 有 值 c<， 那 么 编译 器 可 以 用 c 替 换 在 p 处 的 v 的 使 用 。 
这 一 替换 使 得 编译 器 能 够 基于 值 c 特 化 在 p 处 的 代码 。 例 如 ， 如 果 编 译 器 知道 一 个 循环 的 上 界 ， 那 么 它 通 
常 可 以 消除 测试 这 一 循环 从 不 进入 的 情况 所 需要 的 比较 和 分 支 。 为 了 证 明 v 在 某 个 点 p 处 有 值 c， 编 译 器 
可 以 执行 全 局 常量 传播 。 

这 一 问题 的 定义 域 是 序 对 <v;,，c> 的 集合 ， 其 中 v 是 一 个 变量 且 c 或 者 是 常量 或 者 是 表示 未 知 值 的 特 
殊 值 上 。 分 析 使 用 集合 CONSTANTS(m 来 注释 CFG 中 每 一 个 结 点 ， 这 一 集合 包含 编译 器 可 以 证 明 在 通 
”向 n 的 入口 处 成 立 的 所 有 变量 和 值 的 序 对 。CONSTANTS 集 合 的 定义 如 下 所 示 : 

Constants(n) = A  Fp(CONSTANTS(p)) 
| p € preds(n) . 
其 中 ， 入 在 两 个 序 对 对 集合 上 执行 按 对 求 交 ， BF (x) 是 在 已 知 常量 x 的 集合 上 建 模 p 的 效应 的 块 特定 函 
数 。 对 这 些 需 要 更 详细 的 解释 。 每 一 个 CONSTANTS 和 集合 的 初始 值 是 空 集 。 

上 面 的 求 交 操作 比 较 两 个 序 对 <v，c!> 和 <v，c2> 并 产生 如 下 结果 : Bae, =c,, BA<v, c>A<v, 
c2> 是 <v，c1i>; 如 果 cic,， 那 么 <v，ci> 人 <v，cy> 是 <v，1>。( 注 意 ， 如 果 c 或 c 是 1 ， 那 么 这 些 规则 
产生 <v， 上 >。) 因此 ， 如 果 在 一 条 进入 n 的 路 径 上 v 有 值 3， 而 在 另外 一 条 路 径 上 v 有 值 5， 那 么 编译 器 不 
能 断定 在 通 向 x 的 入 口 处 的 v 的 值 ， 所 以 分 析 使 用 值 上 来 表明 一 个 未 知 值 。 如 果 两 条 路 径 显 示 v 有 相间 的 
值 ， 比 如 说 是 13， 那 么 入 产 生 序 对 <v，13>。 

上 述 方程 的 另 一 个 重要 部 分 是 块 特定 函数 F,。 在 我 们 已 经 看 到 的 其 他 数据 流 框架 中 ， 块 特定 效应 被 
建 模 为 较 小 数量 的 集合 操作 。 给 定 CONSTANTS(p)， 算 法 通过 如 下 方法 建 模 这 一 块 中 的 每 一 个 操作 来 计 
算 在 p 的 尾部 成 立 的 集合 : 

xey if CONSTANTS(p) = {(x, c1), (Y, €2),.. -} then 
CONSTANTS(p) = (CONSTANTS(p) —{( x, cı )}) U {( x, c2)} 


x + y op z if CONSTANTS(p) = {(x, c1), ( Y, C2), (2,3) ...} then a 
CONSTANTS(p) = (CONSTANTS(p) —{( x, €1)}) U {( x, c2 op ca)} . 
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其 中 , 减法 表示 从 集合 中 消除 一 个 项 。 依 次 建 模块 中 的 每 一 个 操作 产生 在 这 个 块 的 尾部 成 立 的 常量 集合 。 
而 这 一 结果 被 用 在 计算 p 的 后 继 的 CONSTANTS 集 合 的 和 操作 中 。 

编译 器 设计 者 可 以 扩展 这 一 模型 使 其 包含 特殊 情况 。 如 果 一 个 操作 中 的 一 个 操作 数 是 未 知 的 ， 而 其 
他 操作 数 已 知 是 这 个 操作 符 的 零 元 或 单位 元 ， 那 么 这 一 模型 可 以 确定 结果 值 。 很 多 操作 符 都 有 这 一 模型 
可 以 检查 的 零 元 或 单位 元 。 

CONSTANTS 的 定义 域 较 大 但 是 是 有 限 的 。 因 为 特定 块 的 CONSTANTS 集 合 中 的 特定 变量 的 值 只 能 
改变 两 次 (从 非特 定 的 到 c, 到 上 )， 所 以 在 实践 中 ， 迁 代 算法 在 这 一 问题 的 实例 上 运行 得 很 快 。 

编译 器 可 以 直接 把 CONSTANTS 集 合 中 的 信息 用 于 改进 代码 。 所 有 参数 都 是 常量 的 操作 可 以 在 编译 
时 评估 ; 任意 对 这 一 评估 结果 值 的 引用 都 可 以 转换 成 使 用 一 个 文字 值 的 引用 。 测 试 中 的 常量 值 可 以 消除 
分 支 。 复杂 计算 中 的 常量 值 可 以 创建 简化 的 机 会 。 把 常量 要 入 引用 的 位 置 是 编译 器 可 以 运用 的 更 有 效 的 
转换 方法 之 一 (参见 10.3.3 节 和 10.4.1 节 中 更 简单 、 更 强大 的 算法 . ) 


9.3 静态 单一 赋值 形式 


长 和 久 以 来 ,很 多 不 同 的 数据 流 问题 已 被 公式 化 。 如 果 每 一 个 转换 使 用 它 自己 特定 的 分 析 ， 那 么 花费 
在 实现 、 调 试 和 维护 分 析 遍 的 时 间 和 精力 会 毫 无 理由 地 增 大 。 为 了 限制 编译 器 设计 者 必须 实现 和 编译 器 
必须 运行 的 分 析 量 ， 理 想 的 做 法 是 使 用 单一 分 析 实 现 多 个 转换 。 

实现 这 一 “普遍 ”分 析 的 一 个 策略 是 构建 这 一 程序 的 一 个 变形 ， 它 把 数据 流 和 控制 流 直 接 编码 到 IR 
中 。5.5 节 和 8.5.1 节 引入 的 静态 单一 赋值 (static single-assignment, SSA) 形式 具有 这 一 性 质 。 它 可 以 充 
当 许 多 转换 的 基础 。 根 据 把 代码 翻译 成 SSA 形 式 的 单一 实现 ， 编 译 器 可 以 执行 很 多 典型 标量 优化 。 

考虑 图 9-6 中 左边 所 示 的 代码 片段 中 的 变量 x 的 不 同 使 用 。 灰 色 的 线 给 出 可 以 达到 的 x 的 每 一 次 使 用 
的 定义 。 而 这 一 图 的 右 侧 给 出 相同 的 片段 ， 只 是 经 过 重 写 把 x 变 成 了 SSA 形 式 。 用 下 标 给 x 的 定义 再 命名 

以 确保 每 一 个 定义 有 惟一 一 个 SSA 名 字 。 为 简单 起 见 ， 我 们 保留 对 其 他 变量 的 引用 不 变 。 


Xo & 17-4 


xel7-4 







X3 — O(xX2»%o) 


Xx, € 13 


X5 € (X4. X3) 
zex Xq 





Xs € p(X1,X5) 
S Wo— x 


源 代码 片段 将 x 变 成 SSA 形 式 
图 9-6 SSA: 在 数据 流 中 编码 控制 流 


上 面 代码 的 SSA 形 式 包含 〈 对 xs、xs 和 xe 的 ) 新 赋值 ， 这 使 x 的 不 同 SSA 名 字 与 (在 对 s 和 z 的 赋值 中 ) 
x 的 使 用 一 致 。 这 些 赋值 保证 沿 着 CFG 中 的 每 一 条 边 x 的 当前 值 被 赋 有 惟一 的 名 字 ， 且 这 一 名 字 与 控制 进 
入 这 一 边 的 路 径 无 关 。 这 些 赋值 的 右 部 包含 一 个 特殊 的 函数 ，$ 函 数 ， 它 把 不 同 边 的 值 结合 起 来 。 
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9 函数 取 与 进入 这 个 块 的 每 一 个 边 相 关 的 值 的 SSA 名 字 作 为 参数 。 当 控制 进入 一 个 块 时 ， 这 个 块 中 
的 所 有 #$ 浮 数 并 行 执行 。 它 们 评估 对 应 于 控制 进入 这 个 块 的 边 的 参数 。 对 应 于 从 左 到 右 的 边 ， 我 们 从 左 
到 右 书写 这 些 参 数 。 在 打印 页 面 上 ， 这 很 容易 。 在 实现 中 ， 它 则 需要 某 种 敌 记 。 

SSA 构 造 法 在 CFG 中 多 条 路 径 汇合 的 每 一 个 点 之 后 插入 一 个 4g 函 数 ， 即 在 每 一 个 连接 点 之 后 插 人 4 函 
- 数 。 在 连接 点 ， 不 同 的 SSA 名 字 必 须 被 调整 成 单一 名 字 。 在 整个 过 程 被 转换 成 SSA 形 式 之 后 ， 两 个 规则 
成 立 : (1) 这 一 过 程 中 的 每 一 个 定义 创建 惟一 的 名 字 ，(2) 每 一 次 使 用 引用 一 个 定义 。 为 了 把 一 个 过 程 
转换 成 SSA 形 式 ， 编 译 器 必须 为 每 一 个 变量 把 适当 的 $ 函 数 插入 代码 中 ， 而 且 它 必须 使 用 下 标 给 变量 再 
命名 使 得 前 两 个 规则 成 立 。 这 一 简单 的 两 步 设计 产生 基本 SSA 构 造 算法 。 


9.3.1 构建 SSA 形 式 的 简单 方法 


- 为 了 构建 一 个 程序 的 SSA 形 式 ， 编 译 器 必须 在 CEFG 中 的 连结 点 处 插入 4 函数 ， 而 且 它 必须 重 命名 变 


量 和 临时 变量 以 便 与 控制 SSA 名 字 空 间 的 规则 一 致 。 算 法 遵从 以 下 要 点 : 

1) 插入 % 函 数 。 在 有 多 个 前 驱 的 每 个 块 的 开始 处 ， 为 代码 在 当前 过 程 中 或 定义 或 使 用 的 每 一 个 名 字 
yA hoy oy, y) 这 样 的 $9 函数。$ 函 数 应 该 对 CFG 中 的 每 一 个 前 驱 块 有 一 个 参数 。 这 一 规则 要 求 在 
每 一 个 需要 $ 沙 数 的 地 方 插入 9 函数 。 它 也 插入 很 多 多 余 的 9 子 数 。 

算法 可 以 以 任意 顷 序 插入 9 函数 。9 函 数 的 定义 要 求 一 个 块 的 顶点 的 所 有 9 函数 并 发 执行 ， 即 它们 同时 
读 取 它们 的 输入 参数 ， 然 后 再 同时 写 出 它们 的 输出 值 。 这 导致 算法 避免 顺序 带 来 的 很 多 不 重要 的 细节 。 

2) 重 命名 。 插 入 函数 之 后 ， 编 译 器 可 以 计算 可 达 定 义 ( 参 见 9.2.4 节 )。 因 为 这 些 已 插入 的 $ 函 数 是 
定义 ， 它 们 确保 对 于 任意 使 用 只 有 一 个 定义 可 以 达到 。 其 次 ， 编 译 器 可 以 重新 命名 变量 和 临时 变量 的 每 
一 次 使 用 以 反映 达到 它 的 定义 。 编 译 器 必须 挑 出 达到 每 一 个 函数 的 定义 ， 并 使 这 些 名 字 与 这 些 定义 到 
达 的 包含 这 一 9 函数 的 块 的 路 径 相对 应 。 这 需要 某 种 籍 记 ， 但 相当 直观 。 | 

这 一 算法 构造 出 程序 的 正确 的 SSA 形 式 。 每 一 个 变量 只 被 定义 一 次 ， 且 每 一 次 引用 使 用 一 个 特定 义 
的 名 字 。 然 而 ， 结 果 的 SSA 形 式 可 能 有 许多 不 需要 的 9 函数 。 这 些 多 余 的 $ 函 数 成 为 一 个 问题 。 它 们 降低 
在 SSA 形 式 上 执行 的 某 些 分 析 的 精确 性 。 它 们 占据 空间 ， 所 以 编译 器 浪费 内 存 来 表示 或 者 是 元 余 的 〈 即 
Xj 一 x1，X1)) 或 者 是 非 活 的 g 函 数 。 它 们 增加 所 有 使 用 结果 SSA 形 式 算法 的 代价 ， 因 为 这 一 算法 必须 遍 
历 所 有 多 余 的 9 函数。 

我 们 称 SSA 的 这 种 版 本 为 “ 极 大 SSA 形 式 (maximal SSA form)”。 构 建 使 用 更 少 98 函 数 的 SSA 形 式 需 
要 更 多 的 工作 ; 特别 是 编译 器 必须 分 析 代 码 以 确定 不 同 的 值 可 能 在 CFG 中 的 汇合 地 点 。 这 一 计算 依赖 于 
我 们 在 8.5.2 节 所 介绍 的 支配 的 概念 。 

以 下 三 小 节 详细 地 给 出 构建 半 剪 枝 SSA 形 式 (semipruned SSA form) 的 算法 ， 这 是 一 个 使 用 较 少 4 
函数 的 算法 版 本 。9.3.2 节 给 出 一 个 快速 算法 ， 这 一 算法 计算 插入 9 函数 所 需要 的 支配 信息 。9.3.3 节 给 出 
一 个 插入 $ 函 数 的 算法 ， 而 9.3.4 节 给 出 如 何 重 写 变 量 名 来 完成 SSA 形 式 的 构造 。9.3.5 节 讨论 把 代码 转换 
画 到 可 执行 形式 时 出 现 的 困难 。 l . 


9.3.2 支配 


最 大 SSA 形 式 的 最 基本 问题 是 它 包 含 太 多 的 9 函数 。 为 了 减少 9 函数 的 数量 ， 编 译 器 必须 更 仔细 地 确 
定 需要 它们 的 位 置 。 高 效 且 准确 地 实现 这 一 点 的 关键 是 支配 信息 。 本 节 开 发 一 种 数据 流 框 架 ， 它 计算 支 
配 者 并 引入 支配 边界 (dominance frontier) 的 概念 。 下 一 节 使 用 支配 边界 改进 9 函数 的 配置 。 

1. 计算 支配 者 

支配 是 编译 的 一 个 最 古老 的 思想 。 在 CFG 中 ， 结 点 i 支配 (dominate) 结 点 jij， 如 果 从 入 口 结 点 到 /的 


Ww 


n 
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每 一 条 路 径 都 通过 结 点 i。 已 经 提出 了 很 多 计算 支配 者 的 方法 。 在 实践 中 ， 简 单 的 数据 流 方法 或 者 更 复 
杂 的 算法 都 可 完成 这 一 工作 。 

为 了 把 支配 计算 公式 化 为 数据 流 问 题 ， 我 们 让 编译 器 使 用 DOM 集 合 注 释 每 一 个 结 点 。 形 式 上 ， 
iEDOM(j) 当 且 仅 当 i 支配 j。 根 据 定义 ;一 个 结 点 支配 其 本 身 ， 所 以 ieDOM(i)。DOM 计 算 的 数据 流 方程 
很 简单 : 


ponm = mu ( N pow 
m € preds(n) 
使 用 初始 条 件 DOM(no) = {no} 且 对 任意 的 nno。，DOM(n)=N， 其 中 N 是 CFG 中 的 结 点 的 集合 。 从 实现 
的 角度 看 ， 最 初 保 留 这 些 集合 的 初始 值 为 空 集 而 不 是 DOM(no)， 且 实现 忽略 空 集 的 集合 交 运算 符 会 更 
有 效 。 

这 一 公式 是 直观 的 。DOM(n) 是 "的 前 驱 的 DOM 集 合 的 交集 ， 再 加 上 mn 本身。 这 一 交集 找到 "的 前 驱 
的 共同 祖先 。 不 在 交集 内 的 任意 结 点 m 交 nn 不 能 位 于 从 no 到 n 的 所 有 路 径 上 。 

可 以 使 用 迭代 算法 求解 DOM 的 这 些 方 程 。 算 法 很 快 就 会 发 现 这 一 问题 的 实例 的 惟一 不 动 点 解 。 

一 个 例子 

考虑 图 9-3 中 的 CFG。 它 的 简 图 如 图 9-7 的 左上 方 所 示 。 结 点 标签 形成 一 个 RPO 编 号 ， 这 是 通过 在 访 
问 左 子 结 点 之 前 访问 右 子 结 点 的 遍历 计算 而 来 的 。 使 用 迭代 算法 并 使 用 上 述 的 顺序 取 结 点 将 产生 上 图 底 
部 的 表 所 示 的 结果 。 


DOM 的 迭代 解决 方案 的 进程 


{0} N N N N N N N 
{0} {0,1} {0,1,2} {0,1,3} {0,1,3,4} {0,1,3,5} {0,1,3,6} {0,1,7} 
{0} {0,1} {0,1,2} {0,1,3} {0,1,3,4} {0,1,3,5} {0,1,3,6} {0,1,7} 





图 9-7 LIVEOUT 例 子 的 支配 关系 


此 图 的 简单 结构 使 得 算法 在 迭代 标签 为 1 的 一 遍 就 可 找到 正确 的 DOM 集 合 。 后 边 〈 即 从 较 高 编号 结 
点 到 较 低 编号 结 点 的 边 ， 本 例 中 是 <B;，B1>) X{DOM(B,) 不 添加 任何 东西 ; 因为 DOM(B1) 被 初始 化 为 N。 
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这 一 算法 需要 第 二 个 遍 来 确认 这 些 集合 不 再 改变 。 

在 图 9-7 的 右上 方 所 示 的 树 是 支配 者 树 (dominator tree) 的 一 个 例子 。( 回想 一 下 我 们 在 8.8.2 节 中 曾 
在 基于 支配 者 的 值 编号 中 使 用 过 这 一 数据 结构 。) 在 这 一 支配 者 树 中 ， 结 点 n 是 它 的 立即 支配 者 IDOM(m) 
的 子 结 点 。 在 这 一 例子 中 ，B,、Bs 和 Be 是 Bs 的 子 结 点 ， 即使 控制 通过 8 或 8 达到 Bo。 

2. 改进 这 一 方法 的 效率 。 

支配 者 的 选 代 框 架 既 简 单 又 直观 。 然 而 ， 由 于 DOM 集 合 的 稀 朴 性 ， 直 截 了 当 的 实现 相对 来 说 效率 
不 高 。 我 们 可 以 通过 注意 到 这 一 算法 只 需要 存储 每 一 个 结 点 的 IDOM 这 一 事实 改进 选 代 支 配 计算 的 效率 。 
它 可 以 从 IDOM 计 算 所 有 其 他 信息 。 | 

IDOM 的 关系 即 编码 这 一 图 的 支配 者 树 ， 又 编码 树 中 每 一 个 结 点 的 DOM 集 合 。 在 图 9-7 中 ，IDOM(6) 
是 3， IDOMG) #£1, IDOM(1) 是 0。6 的 DOM 集 合 是 {0，1，3，6}， 这 些 结 点 刚好 是 位 于 支配 者 树 中 从 6 
到 0 的 路 径 上 的 结 点 。 如 果 我 们 隐 式 地 把 结 点 自身 包含 在 它 自己 的 DOM 集 合 中 ， 那 么 我 们 可 以 通过 从 
IDOM(n) 到 根 遍历 支配 者 树 重建 POM(n)。 

为 了 把 IDOM 用 作 DOM 集 合 的 代理 ， 我 们 需要 计算 两 个 DOM 集 合 的 交集 的 快捷 方法 。 当 我 们 遍历 
支配 者 树 重新 创建 DOM 集 合 时 ， 我 们 以 固定 顺序 遭遇 DOM(m) 中 的 结 点 。 把 这 一 集合 想像 为 一 个 列表 。 
接 这 一 顺序 ， 两 个 DOM 和 集合 的 交集 将 是 它们 的 共同 前 级 。 我 们 可 以 通过 从 每 一 个 表 的 尾部 开始 向 前 端 
遍历 各 表 ， 直 到 找到 一 个 共同 的 结 点 为 止 来 计算 这 个 交集 。 这 一 表 的 其 余部 分 一 定 是 相同 的 ， 第 一 个 共 
同 结 点 可 以 表示 由 交 运 算 产 生 的 DOM 集 合 。 


现在 出 现 一 个 复杂 性 问题 。 在 计算 DOM(i) n DOM(J) 中 ， intersect(i j) 

这 一 算法 在 每 一 点 处 都 需要 知道 是 从 i， 从 j， 还 是 从 二 者 出 发 进 Ws 

一 步 向 前 遍历 。 如 果 我 们 使 用 结 点 RPO 编 号 来 命名 这 些 结 点 ， while (finger! + finger2) 
那么 交集 例 程 可 以 只 比较 这 些 数字 。 图 9-8 给 出 这 一 算法 。 这 一 Min Dee) 
算法 使 用 两 个 指针 沿 树 向 上 跟踪 路 径 。 当 这 两 个 指针 相遇 时 ， while (finger2 > finger1) 


它们 都 指向 代表 交 运 算 的 结果 结 点 。 finger2 = IDom(finger2) 
return finger! 

因此 ，IDOM(m 是 高 效 寻找 DOM(m) 的 关键 。 给 定 每 一 个 
结 点 的 IDOM ， 我 们 可 以 通过 从 "到 mm 向 后 遍历 立即 支配 者 链 来 图 9-8 通过 代理 求 DOM 集 合 的 交集 
得 到 DOM(n)。 这 一 方法 节省 空间 。 所 有 IDOM 集 合 都 只 包含 一 
个 项 ， 所 以 每 个 结 点 有 一 个 单 集 。 这 一 方法 避免 为 一 个 结 点 分 配 并 初始 化 DOM 集 合 所 需 的 代价 。 它 最 
小 化 数据 移动 ， 交 运算 操作 符 从 其 DOM 和 集合 被 结合 的 两 个 结 点 出 发 向 上 遍历 ， 直 到 找到 这 两 个 结 点 的 
最 近 的 共同 支配 者 为 止 。 这 一 操作 的 结果 就 是 找到 那个 结 点 的 名 字 。 通 过 从 第 一 个 共同 祖先 开始 向 上 遍 
历 可 以 得 到 两 个 集合 的 交集 的 其 他 元 素 。 它 是 高 效 的 ， 交 运算 所 花 的 时 间 与 输入 集合 的 大 小 成 正比 ， 而 
不 与 图 的 大 小 成 正比 。 其 结果 是 既 简单 又 快速 的 实现 。 

更 加 困难 的 例子 

图 9-8 给 出 更 加 难以 计算 支配 信息 的 例子 。 这 个 例子 需要 4 次 克 代 。 图 的 右 侧 给 出 算法 在 每 个 阶段 的 
IDOM 数 组 的 内 容 。 符 号 x 表 示 未 初始 化 集合 。 我 们 省 略 了 第 4 次 和 迭代， 在 这 一 迭代 中 IPOM 的 值 不 发 生 
变化 。 

3. 支配 边界 

放置 8 函数 的 关键 在 于 了 解 在 每 一 个 连接 点 处 哪些 变量 需要 9 函数 。 为 了 有 效 而 高 效 地 解决 这 一 问题 ， 
编译 器 可 以 对 这 一 问题 进行 转换 。 对 于 每 一 个 定义 点 ， 编 译 器 可 以 确定 需要 由 这 个 定义 所 创建 的 值 的 $ 
函数 的 连接 点 集合 。 支 配 在 这 一 计算 中 起 着 重要 的 作用 。 
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图 9-9 形态 更 复杂 的 图 


考虑 CFG 中 的 结 点 n 中 的 一 个 定义 。 这 个 值 可 能 无 需 9 函 数 就 能 达到 满足 XEDOM(m) 的 每 一 个 结 点 m， 
因为 达到 m 的 每 一 条 路 径 都 经 过 n。 这 个 值 不 能 达到 m 的 惟一 方式 是 当 相同 名 字 的 另 一 个 定义 出 现在 中 间 
时 ， 即 这 一 定义 出 现在 n 与 m 之 间 的 某 个 结 点 p 处 。 在 这 种 情况 下 ，n 中 的 定义 不 强制 函数 的 存在 ; FAR, 
在 p 处 的 重新 定义 强制 9 函数 的 存在 。 

结 点 n 中 的 定义 迫使 在 n 支 配 的 CFG 区 域外 部 最 近 的 连接 点 处 有 一 个 9 函数 。 更 形式 化 地 说 ， 结 点 n 中 
的 定义 迫使 相应 的 $ 函 数 存在 于 满足 以 下 条 件 的 任意 连接 点 结 点 m 处 : (1) n 支 配 m 的 一 个 前 驱 
(gEpreds(m) H.nEDOM(4)), 以 及 (2) n 不 严格 支配 m， 即 nDOM(m) - {m}。( 增 加 “严格 支配 ”的 概 
念 允 许 在 一 个 块 循环 的 开始 处 存在 8 函数 。 在 这 种 情况 下 ，n =m 且 n 关 DOM(m) —{m}.) 我 们 称 具 有 这 一 
性 质 的 结 点 的 集合 为 n 的 支配 边界 (dominance frontier)， 记 作 DF(n)。 

非 形 式 地 ，DF(n) 包含 在 离开 n 的 每 一 条 CFG 路 径 上 n 不 支配 且 从 nn 开始 可 达 的 第 一 个 结 点 的 全 体 。 在 
图 9-7 的 例子 中 ， B; XAB, Bs 和 Be, 但 是 却 不 支配 B,。 在 每 一 条 离开 B; 的 路 径 上 ， Bj 是 B; 不 支配 的 第 一 
个 结 点 。 因 此 ，DF(B;)= {B}. 

为 了 计算 支配 边界 ， 考 虑 下 面 的 观察 。 第 一 ， 支 配 边界 中 的 结 点 一 定 是 图 中 的 连接 点 。 第 二 ， 任 意 
连接 点 /的 前 驱 ， 除 非 支配 /， 否 则 必定 使 在 它们 相应 的 支配 边界 集合 中 。 这 是 前 述 支配 边界 的 定义 的 直 

接 结 果 。 最 后 ，j 的 前 驱 的 支配 者 必定 使 在 它们 的 支配 边界 集合 中 ， 除 非 它们 也 支配 j。 


for all nodes, n 
DF(n) + ¢ 
for all nodes, n 
ifn has multiple predecessors then 


for each predecessors p of n 
runner + p 
while runner # IDom{n] 
DF(runner) + DF(runner) U {n} 
runner + IDoM(runner) 





图 9-10 计算 支配 边界 


这 些 观察 导致 一 个 简单 的 算法 。 第 一 ， 我 们 识别 每 一 个 连接 点 j; 带 有 多 个 人 边 的 任意 结 点 是 一 个 
连接 点 。 第 二 ,我 们 检查 j 的 每 一 个 CFG 前 驱 p， 并 从 p 开 始 向 上 遍历 支配 者 树 。 当 达到 j 的 立即 支配 者 时 ， 
我 们 停止 遍历 : 除了 j 的 立即 支配 者 之 外 ， 对 于 遍历 中 遇 到 的 每 个 结 点 ，j 都 在 该 结 点 的 支配 边界 中 。 直 
观 上 j 的 前 驱 分 享 j 的 所 有 其 他 支配 者 。 因 为 它们 支配 i， 所 以 它们 不 会 使 在 它们 的 支配 边界 中 。 
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”图 9-10 给 出 这 一 算法 。 需 要 少量 的 籍 记 来 确保 任意 /只 被 加 入 到 一 个 结 点 的 支配 边界 盖 次 。 
例子 
为 了 计算 图 9-7 中 的 图 的 所 有 支配 边界 集合 ， 我 们 需要 CFG 及 CFG 中 每 一 个 结 点 的 DOM。 我 们 可 以 
从 如 图 9-7 的 右上 方 所 示 的 早 前 构建 的 支配 者 树 读 取 每 一 个 结 点 的 DOM 和 IDOM，。 









0 1 2 3 4 5 6 7 
{OF {0,1} {07192} {0,153} 01A 0E S £051,336} {OF DT 
TK na {1} {1} {3} {3} {3} {1} 


为 了 计算 支配 边界 ,分 析 器 在 CFG 中 选择 一 个 连接 点 ， 并 对 这 一 连接 点 的 每 一 个 前 驱 向 上 遍历 这 一 
支配 者 树 。 本 例 的 CFG 有 三 个 连接 点 : 

1) Bs 分 析 器 从 B; 向 后 遍历 到 B3， 把 Be 加 到 DF(B;) 中 。 它 从 Bs 向 后 遍历 到 B3， 把 Be 加 到 DF(B,) 
中 。 

2) B, 它 从 B, 向 后 直接 遍历 到 B,， 把 B; 加 到 DG(B,) 。 它 从 Be 向 后 遍历 到 B; 再 到 B,， 把 B; 加 到 DF(B6) 
和 DF(B,)。 

3) B, Bo 没有 立即 支配 者 ， 所 以 B1FDF(Bo)。 从 Bs 开始 遍历 ， 它 发 现 B; 的 立即 支配 者 是 B,。 因 此 ， 
它 把 B, 加 到 DF(B;) 且 不 加 入 其 他 集合 。 
累积 这 些 结果 ， 我 们 得 到 下 面 的 支配 边界 : 





9.3.3 放置 9 函数 


朴素 的 算法 在 每 一 个 连结 结 点 的 开始 处 为 每 一 个 变量 放置 $ 函 数 。 使 用 支配 边界 ， 编 译 器 可 以 更 精 
确 地 确定 需要 9 函数 的 位 置 。 基 本 想法 是 简单 的 。 块 bp 中 的 x 的 定义 在 DF(5b) 中 的 每 一 个 连接 结 点 处 强制 
一 个 $ 函 数 。 因 为 这 个 yg 函数 是 x 的 一 个 新 定义 ， 所 以 它 可 能 迫使 多 余 的 8 函数 的 插入 。 

编译 器 可 以 进一步 缩小 插入 的 函数 集合 。 只 在 单一 块 中 使 用 的 变量 从 来 没有 活 的 $ 函 数 。 为 了 利用 
这 一 发 现 ， 编 译 器 可 以 计算 在 多 个 块 间 活 着 的 名 字 集 合 ， 我 们 称 这 个 集合 为 全 局 名 字 (global name). 
编译 器 可 以 为 全 局 名 字 插 入 $8 函数， 同时 忽视 在 多 个 块 间 从 不 是 活着 的 所 有 名 字 。( 这 一 限制 把 半 前 枝 
SSA 形 式 与 其 他 类 型 SSA 形 式 区 别 开 来 。) 

编译 器 可 以 很 廉价 地 找到 全 局 名 字 。 在 每 个 块 中 ， 编 译 器 检查 具有 向 上 暴露 使 用 的 名 字 ， 即 活 变量 
计算 中 得 到 的 UEVAR 集 合 。 在 一 个 或 多 个 LIVEOUT 集 合 中 出 现 的 任意 名 字 一 定 在 某 个 块 的 UEVAR 集 合 
中 。 所 有 这 些 UEVAR 集 合 的 并 集 给 出 在 一 个 或 多 个 块 的 入 口 处 是 活着 的 名 字 的 集合 ， 因 此 它 是 在 多 个 
块 中 活着 的 名 字 的 集合 。 

图 9-11 左 侧 给 出 的 算法 得 自 于 LIVEOUT 分 析 所 给 的 计算 。 这 一 算法 构造 单一 集合 610ba1s， 在 这 一 集 
合 中 ，LIVEOUT 的 计算 必须 为 每 个 块 计算 一 个 集合 。 在 它 构建 610ba1s 集 合 的 同时 ， 对 于 每 个 名 字 ， 它 还 
构建 包含 这 个 名 字 的 定义 的 所 有 块 的 列表 。 这 些 块 列表 充当 函数 插入 算法 的 初始 工作 表 ( Worklist). 

插入 9 函数 的 算法 如 图 9-11 右 侧 所 示 。 对 于 每 一 个 全 局 名 字 x， 这 一 算法 使 用 B71ocks(x) 初始 化 
WorkList。 对 于 WorkList 中 的 每 一 个 块 5»， 算 法 在 块 b 的 支配 边界 中 的 每 个 块 d 的 头 部 插入 9 函数 。 根 据 
定义 ， 因 为 一 个 块 中 的 所 有 9 函数 并 行 执行 ， 所 以 这 一 算法 可 以 以 任意 顺序 在 d 的 头 部 插入 这 些 p 函 数 。 
把 x 的 $9 函数 加 入 d 之 后 ， 算 法 把 d 加 入 以 WorkList 中 以 反映 d 中 x 的 新 赋值 。 
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Globals — @ j 
Initialize all the Blocks sets to 0 
for each block b 
VARKILL + 0 
for each operation i in b, in order 
assume that op; is “x + y op z” 


RIF 


for each name x € Globals 
WorkList — Blocks(x) 
for each block b € WorkList 


if y ¢ VARKILL then for each block d in DF(b) 


insert a ¢-function for x in d 
WorkList +- WorkList U {d} 


Globals + Globals U {y} 
if z ¢ VARKILL then 

Globals + Globals U {z} 
VARKILL + VARKILL U {x} 
Blocks(x) + Blocks(x) U {b} 


查找 名 字 





图 9-11 插入 9 函数 


为 了 改进 效率 ， 编 译 器 应 该 避免 两 种 重复 。 第 一 ， 算 法 应 该 避免 对 每 一 个 全 局 名 字 在 工作 表 中 多 次 
放置 任意 块 。 它 可 以 保存 已 处 理 过 的 块 的 清单 。 因 为 算法 必须 为 每 一 个 全 局 名 字 重 置 清 单 ， 所 以 这 一 实 
现 应 该 使 用 稀疏 集合 或 类 似 的 结构 (参见 B.2.3 节 )。 

第 二 ， 一 个 块 可 以 出 现在 WorkList 中 多 个 结 点 的 支配 边界 中 。 为 了 避免 把 变量 (i) 的 8 函数 重复 插 
入 一 个 块 中 ， 编 译 器 可 以 维护 已 经 包含 了 ;的 9 函数 的 块 的 清单 。 这 要 求 一 个 稀疏 集合 ， 它 与 MorkList 一 
同 被 再 初始 化 。 另 一 个 选择 是 在 这 个 块 内 搜索 现存 的 函数 ， 清 单方 法 也 许 更 快 。 

举例 

把 这 一 算法 运用 到 图 9-3 和 图 9-7 所 示 的 例子 的 第 一 步 是 计算 61oba1s 集 合 和 81ocks 集 合 。61oba135 是 
{fa，b，c，d，i}j， 而 81ocks 集 合 是 : 










a b © d i y z 
{1,3} {2, 6} €152, 9} {2,3, 4} {0, 7} {7} 





注意 ， 这 一 算法 为 y 和 z 创 建 81ocks 集 合 ， 即 使 y 和 z 不 在 6Joba1s 内 。 把 61oba1s 的 计算 从 81ocks 的 计算 
中 分 离 出 来 可 以 避免 实例 化 这 些 额 外 的 集合 ， 但 要 以 代码 上 的 另 一 次 遍历 为 代价 。 
这 一 算法 还 需要 CFG 的 支配 边界 ， 我 们 计算 这 一 支配 边界 为 : 






使 用 这 一 信息 ， 分 析 器 可 以 对 图 9-11 的 右 侧 运用 所 示 的 算法 。 

考虑 算法 对 变量 a 所 做 的 工作 。 因 为 a 在 81ocks(a) ={B,，B3} 有 一 个 定义 ， 这 一 算法 必须 在 DF(B)) =O 
和 DF(B3) = {8B;y} 中 的 每 一 个 结 点 处 插入 一 个 9 函数。 把 这 个 9 函数 加 入 By 并 把 B; 加 入 工作 表 。(B; 中 的 9 函 
数 本 身 就 是 a 的 一 个 定义 。) 这 一 算法 在 DF(B;) = {B1} 的 每 一 个 块 中 插入 一 个 $9 函数。 因为 Bl 已 在 工作 表 
中 ， 所 以 这 一 算法 既 不 插入 重复 的 $ 函 数 也 不 把 DF(B1) 加 到 工作 表 中 。 这 就 完成 算法 对 a 的 工作 。 对 于 
610ba1s 中 的 每 一 个 名 字 ， 算 法 做 同样 的 工作 ， 产 生 如 下 的 插入 : 





a b C Gale i 
{7, 6, 1} {7, 6, 1} {1} 


结果 代码 如 图 9-12 所 示 。 
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a e ¢(a,a) 
b < ¢(b,b) 
c e ¢(c,c) 
d + ¢(d,d) 
i e ¢(i,i) 
a een 
Cee 












c e ¢(c,c) 
d — ¢(d,d) 











a e ¢(a,a) 
b + (b,b) 
c e ¢(c,c) 
d — ¢(d,d) 
yeathb 
zectd 
icit+l 










图 9-12 使 用 4 函数 的 例子 


把 这 一 算法 限制 于 全 局 名 字 上 使 其 避免 在 块 B, 中 为 x 和 y 插 入 死 9 函 数 。( 8 是 DF(B)) ， 而 B) 包 含 x 和 y 
的 定义 。) 然而 ， 局 部 名 字 和 全 局 名 字 之 间 的 差异 不 足以 避 开 所 有 死 9 函数 。 块 8 中 a 和 c 的 9 函数 是 死 的 ， 
因为 两 个 名 字 在 它们 的 值 被 使 用 之 前 都 被 重新 定义 。 为 了 避免 插入 这 些 死 $ 函 数 ， 编 译 器 必须 构造 
LIVEOUT 和 集合 ， 并 把 一 个 基于 活性 的 试 测 加 入 9 函数 插入 算法 的 内 循环 中 。 


9.3.4 重 命 名 


在 对 极 大 SSA 形 式 的 描述 中 ， 我 们 提 到 重 命名 变量 在 概念 上 是 直观 的 。 然 而 ， 其 细节 需要 进一步 
解释 。 

在 最 终 的 SSA 形 式 中 ， 每 个 全 局 名 字 有 单一 基 名 字 ， 而 且 我 们 通过 在 基 名 字 的 各 个 定义 中 加 入 数字 
下 标 来 区 分 它们 。 对 应 于 源 语言 变量 ， 如 x， 的 一 个 名 字 ， 算 法 把 x 用 作 基 名 字 。 因 此 ， 重 命名 算法 在 遇 
到 x 的 第 一 个 定义 时 将 其 命名 为 x。， 而 遇 到 的 x 的 第 二 个 定义 时 将 其 命名 为 x。 对 于 编译 器 生成 的 临时 变 
R, 算法 必须 生成 不 同 的 名 字 。 | 

重 命名 算法 在 前 序 遍 历 支配 者 树 的 过 程 中 重 命名 定义 及 其 使 用 。 在 每 个 块 中 ， 它 首先 重 命名 在 这 个 
块 的 头 部 的 9 函数 定义 的 值 ， 然 后 ， 它 依次 访问 这 个 块 中 的 每 一 个 操作 。 它 使 用 当前 SSA 的 名 字 重 写 每 
一 个 操作 的 操作 数 ， 然 后 对 这 一 操作 的 结果 创建 一 个 新 的 SSA 名 宇 。 后 者 的 动作 使 这 个 新 名 字 为 当前 名 








270 | RO* 


字 。 当 块 中 所 有 操作 都 被 重 写 之 后 ， 算 法 使 用 当前 SSA 的 名 字 重 写 这 一 块 的 每 一 个 CFG 后 继 中 的 适当 
函数 的 参数 。 最 后 ， 它 对 支配 者 树 中 这 个 块 的 所 有 子 结 点 重复 这 一 工作 。 当 它 从 这 些 递归 调用 返回 时 ， 


它 再 把 当前 SSA 名 字 的 集合 恢复 到 当前 块 被 访问 之 前 已 存在 的 状态 。 


为 了 管理 这 一 过 程 ， 编 译 器 为 每 一 个 全 局 名 字 使 用 一 个 计数 器 和 一 个 栈 。 名 字 栈 保存 这 个 名 字 的 最 
近 下 标 ， 即 这 个 名 字 的 当前 SSA 名 字 。 在 每 一 个 定义 处 ， 算 法 通过 把 这 一 全 局 名 字 的 当前 计数 器 的 值 压 
入 栈 中 并 递增 计数 器 为 这 个 目标 名 字 生 成 一 个 新 下 标 。 栈 顶 的 值 是 新 的 SSA 名 字 。 作 为 处 理 一 个 块 的 最 
后 一 步 ， 算 法 把 在 那个 块 中 所 生成 的 所 有 名 字 都 从 相应 的 栈 弹 出 。 这 恢复 在 这 个 块 的 立即 支配 者 中 保存 
的 名 字 和 集合 ， 如 果 需 要 ， 可 以 在 支配 者 树 中 这 个 块 的 兄弟 结 点 复 用 这 个 栈 。 

栈 和 计数 器 用 于 不 同 的 目的 。 当 算法 中 的 控制 上 下 游 走 于 支配 者 树 时 ， 栈 被 指定 来 模拟 当前 块 中 
最 近 定 义 的 生存 期 。 另 一 方面 ， 计 数 器 单调 递增 以 确保 每 一 个 后 继 对 <name，subscript> 映 射 到 不 同 的 
定义 。 


| ssA 形 式 的 不 同 风格 


| “文献 中 已 提出 了 SSA 形 式 的 若干 不 同 风格 。 各 个 风格 的 不 同 在 于 它们 插入 9 函数 的 标准 不 同 。 

于 给 定 程序 ， 这 些 SSA 形 式 产生 不 同 的 4 函数 集合 。 | 
| O 极 小 S54 在 原来 相同 的 名 字 相遇 的 两 个 不 同 定义 的 所 有 连接 点 处 插入 一 个 g 函 数 。 这 是 与 SSA | 
| 的 定义 一 至 的 最 小 数目 。 然 而 ， 其 中 的 一 些 $ 函 数 可 能 是 死 的 ;定义 并 没有 说 明 当 值 相 过 时 它们 必 | 
| 须 是 活 的 。 | 
| BASSA 给 4 插入 算法 加 上 一 个 活性 测试 以 确保 只 加 入 活 的 9 函数 。 这 一 构造 法 必须 计算 | 


| LIVEOUT 集 合 ， 所 以 构建 前 枝 SSA 的 代价 比 构建 最 小 SSA 的 代价 要 高 。 


FWRSSA ”是 最 小 SSA 和 前 枝 SSA 的 折 囊 。 在 插入 9 函数 之 前 ， 这 一 算法 消除 所 有 在 跨越 块 边 | 


| 界 时 非 活 的 名 字 。 从 而 缩小 名 字 空间 且 在 没有 增加 计算 LIVEOUT 集 全 的 负荷 的 情况 下 减少 y 函 数 的 | 
| 数量 。 这 就 是 图 9-11 给 出 的 算法 。 | 


当然 ，$ 函 数 的 数量 依赖 于 被 转换 成 SSA 形 式 的 特定 程序 。 对 于 某 些 程序 ， 通 过 半 前 枝 SSA 和 更 | 


| 柜 SSA 得 到 的 4 函数 数量 的 减少 是 显著 的 。 缩 小 SSA 形 式 可 以 导致 更 快 的 编译 ， 因 为 使 用 SSA 形 式 的 | 
| 饥 可 以 在 包含 较 少 操作 ， 即 含有 较 少 4 函数 的 程序 上 的 操作 。 | 





图 9-13 概 插 出 这 一 算法 。 它 初始 化 栈 和 计数 器 ， 然 后 ， 在 支配 者 树 的 根部 调用 Rename， 这 是 CFG 的 


f Rename(b) 
for each global name i ‘for each -function in b, x — o(-+-)" 
counter[i] +- 0 rename x as NewName(x) 
pall eð -> for each operation % +- y op 2” in b 
ename(no) rewrite y as top(stack[y]) 
. rewrite z as top(stack[z]) 
rewrite x as NewName(x) 
for each successor in the CFG 
fill in ¢-function parameters 


NewName(n 
ie re 7 for each successor s in the dominator tree 
counter[n] + counter[n] + 1 Rename(s) 
push n; onto stack[n] for each operation “x + y op z” in b 
return n; and each ¢-function “x — (---)” 

pop(stack[x}) 





图 9-13 9 函数 插 和 人 后 的 重 命名 
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口 结 点 。Rename 重 写 这 个 块 并 在 这 一 支配 者 树 中 的 后 继 上 进行 递归 调用 。 在 结束 这 个 块 上 的 操作 时 ， 
Rename 弹 出 处 理 这 个 块 时 压 入 栈 中 的 所 有 名 字 。 函 数 NewName 处 理 计 数 器 和 栈 来 创建 所 需 的 新 名 字 。 

还 有 最 后 一 点 细节 。 在 块 b5 的 尾部 ，Rename 必 须 重 写 b 的 每 一 个 CFG 后 继 中 的 8 函数 的 参数 。 编 译 器 
必须 在 那些 5 的 % 国 数 中 指定 一 个 顺序 参数 槽 。 当 我 们 画 出 SSA 形 式 时 ， 我 们 总 是 假设 从 左 到 右 的 顺序 ， 
这 与 绘制 边 时 的 从 左 到 右 顺 序 相 匹配 。 在 内 部 ， 编 译 器 可 以 以 任意 产生 理想 结果 的 相 容 方式 对 边 和 参数 
村 进行 编号 。 这 需要 构建 SSA 形 式 的 代码 与 构建 CFG 的 代码 之 间 的 合作 。( 例 如 ， 如 果 CFG 实 现 使 用 离 
开 每 个 块 的 边 的 列表 ， 那 么 这 一 列表 的 顺序 可 以 决定 映射 。) 

1. 举例 

为 了 完成 我 们 的 例子 ， 让 我 们 对 图 9-12 运 用 重 命 名 算法 。 假 设 a。、b。、co 和 do 在 Bo 的 入 口 被 定义 。 
图 9-14 给 出 这 一 过 程 中 各 个 不 同 点 处 的 全 局 名 字 计 数 器 以 及 栈 的 状态 。 带 标签 “Before B;” 的 图 展示 当 
Rename 被 块 B, 调 用 时 的 计数 器 和 栈 。 带 标签 “End of B,” 的 图 给 出 在 处 理 这 个 块 之 后 且 Rename 从 各 个 
栈 弹 出 B 的 名 字 之 前 的 状态 。 图 9-14 给 出 每 个 块 的 尾部 的 状态 ;. 为 了 清晰 起 见 ， 它 还 包含 B6。、Bs 和 8B) 的 
入 口 状 态 。 


C a b c d 


i 
计数 器 To | 
|a | bo | co | to | 校 La | bo | co | do | io | 


Bo 之 前 Bo 末尾 





BARB Bs 末尾 
图 9-14 重 命名 例子 中 的 状态 
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BAR 


图 9-14 ( 续 ) 


这 一 算法 前 序 遍 历 支配 者 树 以 从 Bo 到 B, 的 递增 顺序 访问 各 结 点 。 当 它 处 理 各 块 时 ， 它 采取 下 面 的 动作 : 

1) Bo。 这 个 块 只 包含 一 个 操作 。Aename 使 用 io 重 写 1 ， 递 增 计 数 器 ， 并 把 fo 压 和 人 i 的 栈 。 接 下 来 ， 它 
用 当前 的 状态 ao、bo、co、de 和 io 中 适当 的 名 字 重 写 每 一 个 4 函数 的 第 一 个 参数 。 然 后 ， 它 在 6 在 支配 者 
树 中 的 子 结 点 8, 上 递归 进行 相同 的 操作 。 在 这 之 后 ， 它 对 i 的 相关 栈 做 弹出 操作 并 返回 。 

2) B81。 在 进入 BI 时 ，Rename 使 用 新 名 字 a,、b;、ci!、d1 和 i1 重 写 $ 冰 数 的 目标 。 接 下 来 ， 它 把 a 和 c 的 
定义 重 写 为 a 和 c, 的 定义 。B, 的 CFG 后 继 都 没有 9 函数 。 接 下 来 ， 它 在 B1 的 支配 者 树 中 的 子 结 点 B,、B; 上 
递归 进行 相同 的 操作 。 它 弹出 这 些 栈 并 返回 。 

3) 8,。 这 一 块 没 有 需要 重 写 的 $9 函数 。 按 下 来 ，Rename 重 写 三 个 操作 ， 创 建 b,/、c3 和 d,。 然 后 ， 它 
使 用 保存 在 B, 的 尾部 的 适当 名 字 a。、b;,、c3 和 ds 取代 Bs 的 CFG 后 继 B, 中 的 每 一 个 $8 函数 的 第 一 个 参数 ， 以 
此 来 重 写 $ 函 数 的 参数 。 最 后 ， 它 弹出 这 些 栈 并 返回 。 

4) B; FÆ, Rename a MEB E. REMEH “Before B?” HEA. CHWAKA “End of B,” 
的 栈 和 来 自 于 “End of 8B,” 的 计数 器 。 它 使 用 a 和 ds 重 写 两 个 赋值 。B; 的 所 有 CFG 后 继 都 没有 需要 处 理 
的 8 函数 。Rename 递 归 运 用 与 B, 在 支配 者 树 的 子 结 点 B4、Bs; 和 Be 上 。 它 弹出 这 些 栈 并 返回 。 

5) B,。 这 个 块 有 一 个 操作 。Rename 重 写 d 为 d,。 接 下 来 ， 它 使 用 相应 的 当前 名 字 c2 和 ds 重 写 Be 中 每 
一 个 9g 函 数 的 第 一 个 参数 。 它 弹出 d 的 栈 并 返回 。 

6) Bs。 这 个 块 也 有 一 个 操作 。Rename 重 写 c 为 c,，， 然 后 重 写 Be 中 每 一 个 $ 函 数 的 第 二 个 参数 。 这 些 
参数 都 变 成 ck 和 d:。 它 弹出 c 的 栈 并 返回 。 . 

7) Be。Rename 重 写 9 函数 的 目标 为 cc 和 ds。 它 重 写 给 对 b 的 赋值 为 对 b: 的 赋值 。 接 着 ， 它 使 用 当前 
SSA 名 字 (a;、b;3、cs 和 ds) 重 写 B, 中 每 一 个 9 函数 的 第 二 个 参数 。 因 为 Be 在 支配 者 树 中 没有 子 结 点 ， 所 
以 它 向 上 返回 到 83， 在 此 它 返 回 到 B,。 它 向 下 对 B, 的 最 后 一 个 支配 者 树 的 子 结 点 By 递归 进行 同样 的 操作 。 
它 弹出 这 些 栈 并 返回 。 

8) B,。 首 先 ，Rename 重 写 $ 函 数 的 目标 ， 创 建 a:z、bs、ce 和 de。 它 重 写 接 下 来 的 两 个 赋值 中 的 全 局 
名 字 的 使 用 ,但 不 重 写 它们 的 目标 ， 因 为 yY 和 z 都 不 是 全 局 名 字 。 在 最 后 一 个 赋值 中 ， 它 使 用 ii 重 写 这 一 
使 用 ， 然 后 为 这 个 定义 创建 一 个 新 名 字 i,。 

B, 只 有 一 个 CFG 后 继 B,。Rename 使 用 它 的 当前 SSA 名 字 (a4、b。、cs、de 和 i,) 重 写 81 中 每 一 个 8 函 
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数 的 第 二 个 参数 。Aename 弹 出 栈 ， 返 回 到 B,， 再 到 Bo， 然 后 停止 。 
图 9-15 给 出 Rename 停 止 后 的 代码 。 









al & p(aosas) 
bı e (bo, bs) 
cl & $(co,ce) 
dı — $(do, de) 
4, — olio 2) 
az 全 … 

Co 《一 … 
















Cs € $(c2,c4) 
ds <— $ldasd3) 
bs ew 











a4 — (a2, a3) 
by — ¢(bz,b3) 
Ce pCa C5) 
ds e o(d2,d5) 
y & a + by 
Z & Ce + dg 
iz ef iy +1 


i > 100 










图 9-15 重 命名 后 的 例子 


2. 最 后 的 改进 

NewName 的 巧妙 实现 可 以 减少 消耗 在 栈 处 理 上 的 时 间 和 空间 。 栈 的 主要 使 用 是 在 块 的 出 口 处 重新 设 
置 名 字 空 间 。 如 果 一 个 块 几 次 重新 定义 相同 的 基 名 字 ， 那 么 NewName 只 需要 保存 最 新 的 名 字 。 这 发 生 在 
本 例 中 的 块 B, 中 的 a 和 c 上 。NewName 可 能 在 单一 块 内 多 次 覆 写 相 辣 的 栈 材 。 

这 使 得 栈 的 最 大 大 小 可 以 预测 ; 没有 栈 能 比 支配 者 树 的 深度 大 。 这 降低 整个 空间 的 需求 量 ， 避 免 每 次 
压 和 人 栈 时 进行 溢出 测试 ， 并 碱 少 压 入 和 弹出 操作 的 数量 。 我 们 需要 另 一 种 机 制 来 确定 在 一 个 块 的 出 口 对 哪 
些 栈 做 弹出 操作 。NewWame 可 以 线索 化 一 个 块 的 栈 入 口 。Rename 可 以 使 用 这 一 线索 对 适当 的 栈 做 弹出 操作 。 


9.3.5 从 SSA 形 式 重 新 构造 可 执行 代码 


因为 处 理 器 不 实现 4g 函 数 ， 所 以 编译 器 必须 把 SSA 形 式 翻 译 回 可 执行 代码 。 查 看 我 们 的 例子 ， 我 们 
非常 愿意 相信 编译 器 可 以 简单 地 消除 名 字 的 下 标 并 删除 4 函数 。 如 果 编 译 器 仅 构建 SSA 形 式 ， 并 把 SSA 转 
换 回 可 执行 代码 ， 那 么 这 一 方法 可 行 。 然 而 ， 依 赖 于 SSA 名 字 空 间 的 转换 可 能 致使 这 一 简单 的 重 命名 过 
程 生成 不 正确 代码 。 





474 


274 BOE 





在 局 部 值 编 号 (LVN) F, 我们 已 看 到 使 用 SSA 名 字 空 间 使 转换 可 以 发 现 和 消除 更 多 的 元 余 。 
初始 名 字 空 间 名 字 空 间 





Before LVN After LVN Before LVN After LVN 
acxd+y acx+y ao + Xo + Yo ao + Xo + Yo 
bext+y bea bo + Xo + Yo bo + ao 
a+l7 acl7 al 人 二 17 al 全 17 
cex+y cex+y Co + Xo + Yo Co + ao 


上 表 左 侧 的 代码 给 出 一 个 有 四 个 操作 的 块 ， 以 及 当 LVN 使 用 来 自 源 代码 的 名 字 空间 时 ， 它 所 产生 的 
结果 。 右 侧 代码 给 出 使 用 SSA 名 字 空 间 的 相同 的 例子 。 因 为 SSA 名 字 空 间 给 ao 一 个 不 同 于 aa 的 名 字 ， 所 
以 LVN 可 以 使 用 对 ao 的 引用 取代 最 后 操作 中 的 xe+ yo 的 评估 。 

然而 ， 请 注意 ， 去 掉 变 量 名 字 上 的 下 标 产生 不 正确 的 代码 ， 因 为 它 给 c 赋 值 17。 诸 如 代码 移动 和 持 
贝 稚 入 等 更 大 胆 的 转换 可 能 以 某 种 方式 重 写 SSA 形 式 ， 而 这 种 方式 可 能 引发 更 微妙 的 问题 。 

为 了 避免 这 样 的 问题 ， 编 译 器 可 以 保存 SSA 名 字 空 间 的 完整 性 ， 并 使 用 一 组 拷贝 操作 取代 每 一 个 9 
函数 ， 即 沿 着 每 一 个 进入 边 使 用 一 个 拷贝 操作 。 对 于 9 函数 X14 一 认 X12:，X13)， 编 译 器 应 该 沿 着 携带 值 x1 
的 边 插 入 Xi 一 x1z 并 说 着 携带 值 x13 的 边 插入 拷贝 Xj4< 一 xX1。 图 9-16 给 出 9 函数 被 找 贝 操作 取代 后 的 运行 例子 。 
Bj 中 的 四 个 $9 函数 已 被 8, 和 Bs 中 的 各 自 四 个 撕 贝 取代 。 同 样 地 ，Be 中 的 两 个 8 函数 引发 出 B 和 Bs 中 的 各 自 
一 对 拷贝 。 对 于 这 两 种 情况 ， 编 译 器 可 以 把 拷贝 插入 前 驱 模 块 中 。 

B; 中 的 9 函数 揭示 出 更 复杂 的 情况 。 因 为 它 的 前 驱 块 有 多 个 后 继 ， 所 以 编译 器 不 能 在 它 的 前 辈 的 尾 
部 插入 拷贝 操作 。 把 拷贝 直接 插入 前 驱 中 将 促使 这 些 拷贝 在 循环 的 出 口 路 径 (标签 1> 100) 中 执行 。 没 
有 关于 沿 着 这 些 出 口 路 径 可 以 达到 的 代码 的 详细 信息 ， 我 们 不 能 告知 插入 的 这 些 找 贝 是 否 会 产生 不 正确 
的 行为 。 然 而 ， 它 一 般 可 能 产生 不 正确 的 行为 。 编 译 器 也 不 能 在 81 的 顶部 插入 拷贝 操作 ; 这 些 拷贝 必须 
使 用 这 样 的 名 字 ， 通 过 这 些 名 字 ， 在 前 驱 块 中 这 些 值 是 可 知 的 。 

为 了 解决 这 一 问题 ， 编 译 器 可 以 分 离 从 Bo 到 B, 和 从 Bs 到 B 的 边 ， 并 在 各 边 的 中 间 插 入 一 个 块 来 保存 
这 些 找 贝 ， 如 图 9-16 所 示 。 源 头 有 多 个 后 继 且 目标 有 多 个 前 驱 的 边 称 为 一 个 临界 边 (critical edge). #& 
入 块 B 和 Bs 破坏 这 一 临界 边 。 插 入 拷贝 之 后 ， 本 例 表面 上 出 现 多 个 多 余 的 措 贝 。 幸 运 的 是 ， 编 译 器 可 以 
使 用 诸如 拷贝 登入 等 一 系列 优化 尽 可 能 地 (如 果 不 是 完全 ) 消除 它们 (参见 13.5.6 节 )。 

分 离 临 界 边 为 拷贝 操作 创建 必要 的 位 置 并 消除 拷贝 插入 期 间 引 发 的 大 部 问题 。 然 而 ， 它 却 可 能 带 来 
两 个 更 微妙 的 问题 。 第 一 个 问题 称 为 无 效 拷贝 间 题 (lost-copy problem)， 这 一 问题 是 大 胆 的 程序 转换 和 
临界 边 的 组 合 引发 的 。 第 二 个 问题 称 为 交换 问题 (swap problem )， 这 一 问题 是 某 些 大 胆 的 程序 转换 和 
SSA 形 式 的 详细 定义 间 的 相互 影响 引发 的 。 

1. 无 效 拷贝 问题 

很 多 基于 SSA 的 算法 要 求 分 离 临界 边 。 然 而 ， 有 时 候 编译 器 不 能 或 不 应 该 分 离 临界 边 。 例 如 ， 如 果 
这 个 临界 边 是 反复 执行 的 循环 的 后 边 ， 那 么 增加 一 个 带 有 一 个 或 多 个 拷贝 操作 和 一 个 跳 转 的 块 可 能 会 对 
执行 速度 有 不 利 的 影响 。 同 样 地 ， 在 编译 的 后 期 阶段 增加 块 和 边 可 能 对 非 局 部 调度 、 寄 存 器 分 配 和 诸如 
代码 替换 等 优化 产生 干扰 。 

无 效 拷贝 问题 发 生 于 拷贝 年 入 和 不 可 分 离 的 临界 边 的 组 合 。 图 9-17 给 出 一 个 例子 。 左 板 面 的 上 方 给 
出 源 代码 一 一 一 个 简单 的 循环 。 在 下 一 个 板 面 中 ， 编 译 器 把 这 一 循环 转换 成 了 SSA 形 式 并 对 从 1 到 y 的 拷 
贝 进行 了 友 入 ， 使 用 对 i 的 引用 取代 y 的 惟一 使 用 。 右 上 方 板 面 给 出 直接 把 拷贝 插入 9 函数 的 前 驱 块 中 所 
产生 的 代码 。 这 改变 循环 后 用 于 给 zo 的 赋值 语句 中 的 值 。 源 代码 赋 给 它 1 的 倒数 第 二 个 值 ， 而 转换 后 的 
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代码 赋 给 它 1 的 最 后 值 。 左 板 面 的 下 方 表明 分 离 临界 边 ， 即 循环 的 后 边 ， 产 生 正确 的 行为 。 然 而 ， 它 把 
一 个 跳 转 加 到 这 一 循环 的 每 一 次 迭代 中 。 l 











y & a + dy 
Ze Ce +de 
iei +1 


图 9-16 + MEA RIAT 476 


iel io 二 1 igel 
i Gio 
yei i i; < (io, iz) igi, +1 
jeitil ` i izei +1 i ip 
zeyr:: Zo ei +t -> Zoi; + … 
源 代码 拷贝 登入 后 的 
SSA 形 式 拷贝 插入 不 正确 
igel io 二 1 
i, ip i; eig 
eit) ige- i, +1 
t ci; 
iei: i; + i2 
| 
zei t- Zo 《t+ … 
分 离 临界 边 拷贝 插入 正确 


图 9-17 无 效 拷贝 问题 的 例子 477 
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.这 一 问题 是 由 于 不 可 分 离 的 临界 边 和 名 字 空 间 的 拷贝 短 入 处 理 的 组 合 而 产生 的 。 拷 贝 熏 人 通过 在 昆 
随 循环 之 后 的 块 中 把 ii 笃信 对 y 的 引用 来 消除 赋值 y 生 1。 这 延长 了 1 的 生存 期 。 于 是 ， 拷 贝 插入 算法 使 用 
那个 块 的 每 一 个 前 驱 中 的 拷贝 操作 取代 循环 体 顶部 的 9 函数 。 这 在 这 个 模块 的 底部 插入 拷贝 i.<-1,， 在 这 
一 地 点 和 仍然 活着 。 

为 了 避免 无 效 拷贝 ， 编 译 器 必须 发 觉 它 在 试图 插入 一 个 目标 仍然 是 活 的 拷贝 。 当 这 一 情况 发 上 生 
时 ， 它 必须 把 这 个 值 拷 贝 到 一 个 临时 名 字 ， 并 使 用 这 个 新 临时 名 字 重 写 已 被 禾 写 的 名 字 的 以 后 的 使 
用 。 使 用 模拟 SSA 重 命名 算法 的 一 个 步骤 可 以 实现 这 一 重 写 步 最。 图 9-17 右 板 面 底部 给 出 这 一 方法 
产生 的 代码 。 

2. 交换 问题 

9$ 销 数 的 性 质 使 得 插入 算法 得 以 按 任意 顷 序 引入 函数 。 这 一 性 质 诱发 交换 问题 。 当 一 个 块 执 行 时 ， 
它 的 所 有 9 函数 都 假设 在 这 个 块 中 的 其 他 所 有 语句 之 前 同时 执行 。 这 个 块 中 的 所 有 9 函数 同时 读 取 它 们 的 
适当 的 输入 参数 。 然 后 ， 它 们 重 定义 其 目标 值 ， 所 有 这 些 都 在 同一 时 间 内 进行 。 

图 9-18 给 出 交换 问题 的 一 个 简单 例子 。 图 的 左 侧 给 出 源 代码 ， 这 是 交换 x 和 y 的 值 的 简单 循环 。 图 的 
中 央 部 分 给 出 转换 成 SSA 形 式 并 进行 了 大 胆 的 找 员 彼 入 的 代码 。 在 这 一 形式 中 ， 由 于 9 函数 的 评估 规则 ， 
这 一 代码 保留 它 原来 的 意义 。 当 循环 体 执行 时 ，9 函 数 参 数 在 所 有 $$ 函数 的 目标 被 定义 之 前 被 读 取 。 在 第 
一 次 返 代 中 ， 代 码 在 定义 x; 和 yi 之 前 读 取 xo 和 ye。 在 后 继 氨 代 中 ， 它 在 重新 定义 xi 和 yi 之 前 读 取 xi 和 yi 。 
图 中 的 右 侧 给 出 经 过 实施 朴素 的 拷贝 插 人 算法 后 的 相同 代码 。 因 为 拷贝 是 顺序 执行 ,而 不 是 同时 执行 的 ， 
所 以 xi 和 yi 不 正确 地 得 到 相同 的 值 。 


Xo ee 
X e Yoo 


Yoru Xo e e X; & Xo 
| Y e-s yl 二 yo 
tex . | | 
Key xl e (x01) | oO Rey | 
y i yı radii yı re 
源 代码 拷贝 稚 人 后 的 经 朴素 的 拷贝 
SSA 形 式 插入 后 的 代码 


图 9-18 交换 问题 示例 


初 看 起 来 ， 似 乎 分 离 作 为 临界 边 的 后 边 是 有 帮助 的 。 然 而 ， 这 只 是 以 同样 的 顺序 在 另 一 个 块 中 放置 
相同 的 两 个 拷贝 。 为 了 修复 这 一 问题 ， 编 译 器 可 以 把 这 些 值 中 的 每 一 个 拷贝 到 一 个 临时 变量 来 模拟 4 函 
数 的 规定 行为 。 这 在 形成 循环 体 的 块 中 产生 四 个 赋值 的 序列 ty;、Ss< 一 x:、xi<t 和 yi< 一 s。 址 恨 的 是 ， 
它 使 循环 中 的 操作 的 数量 加 倍 ， 所 以 这 不 是 这 一 问题 的 最 好 的 解决 方案 。 相 反 ， 编 译 器 应 该 最 小 化 它 播 
入 的 拷贝 数量 。 

事实 上 ， 交 换 问 题 不 要 求 拷贝 的 循环 集合 ; 它 所 取 的 是 一 组 这 样 的 9 函数 ， 这 些 9 函 数 的 输入 变量 被 
定义 为 同一 块 中 其 他 9 函数 的 输出 。 对 于 这 样 的 无 循环 情况 ， 编 译 器 可 以 通过 对 已 插入 的 $ 函 数 作 细心 的 
排序 来 避免 这 一 问题 。 

为 了 解决 这 一 问题 ， 编 译 器 一 般 可 以 查 明 9 函 数 引 用 相同 模块 中 其 他 9 函数 的 目标 的 情况 。 对 于 每 一 
个 引用 循环 ， 它 必须 插入 一 个 到 临时 变量 的 拷贝 来 破坏 循环 。 然 后 ， 它 可 以 调度 拷贝 操作 来 反映 9 函数 
所 蕴涵 的 相关 性 。 
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9.4 高 级 话题 


本 章 集 中 讨论 了 和 迭代 数据 访 分 析 和 SSA 形 式 的 构造 法 ， 这 些 内 容 将 直接 且 高 效 地 体现 过 程 中 诸多 的 
数据 流 关系 。 流 向 图 的 一 个 性 质 对 其 他 非 迭 代 的 数据 流 算法 是 重要 的 ; 无 论 这 一 图 是 否 是 可 约 的 
(reducible)。9.4.1 节 讨论 流向 图 的 可 约 性 。 

本 章 迄 今 为 止 ， 所 有 例子 都 来 自 于 全 局 GEE) 数据 流 分 析 。9.4.2 节 介绍 在 把 数据 流 分 析 的 作用 
域 从 过 程 扩 展 到 整个 程序 时 出 现 的 问题 。 它 展示 作用 域 大 于 单一 过 程 的 若干 分 析 问 题 的 主要 观点 。 


9.4.1 结构 数据 流 算法 和 可 约 性 


9.2.2 节 给 出 迭代 算法 ， 因 为 这 一 算法 一 般 在 任意 图 上 的 合式 方程 集合 上 都 可 行 。 存 在 其 他 数据 流 算 
法 ; 其 中 很 多 算法 的 工作 模式 都 是 首先 得 到 被 分 析 代 码 的 控制 流 结构 的 简单 模型 ， 并 使 用 这 一 模型 求解 
方程 。 通 常 ， 这 一 模型 是 由 一 系列 降低 复杂 性 的 得 到 这 个 图 的 转换 构成 的 ， 即 以 细心 的 方式 将 结 点 或 边 
结合 起 来 。 这 种 图 归 约 过 程 是 除 迭 代 算 法 之 外 几乎 所 有 数据 流 算 法 的 核心 。 

非 挝 代数 据 流 算法 一 般 是 通过 把 一 系列 转换 运用 到 一 个 流向 图 来 工作 的 ， 其 中 每 一 个 转换 选择 一 个 
子 图 并 用 一 个 表示 这 个 子 图 的 单一 结 点 取代 这 一 子 图 。 这 创建 一 系列 派生 图 ， 其 中 每 一 个 图 与 序列 中 它 
的 前 驱 之 间 的 差异 是 一 个 单一 转换 步骤 的 效应 。 当 分 析 器 转换 这 个 图 时 ， 它 计算 数据 流 集合 来 寻找 后 继 
派生 图 中 的 新 代表 结 点 。 这 些 集合 总 括 被 取代 子 图 的 效应 。 这 些 转换 把 行为 良好 的 图 归 约 到 单一 结 点 。 
然后 ， 这 一 算法 颠倒 这 一 过 程 ， 从 它 最 后 的 单一 结 点 的 派生 图 开始 ， 返 回 到 原来 的 流向 图 。 当 分 析 器 把 
这 个 图 展开 回 到 它 原来 的 形式 时 ， 它 计算 每 一 个 结 点 的 最 终 数 据 流 集合 。 

本 质 上 ， 轨 约 阶段 收集 整个 图 的 信息 并 把 图 合并 起 来 ， 而 展开 阶段 则 是 把 合并 起 来 的 集合 中 的 效应 
传播 回 到 原来 图 的 结 点 上 。 任 意 归 约 阶段 成 功 的 图 被 认为 是 可 约 的 (reducible )。 如 果 一 个 图 不 能 被 简 
化 到 单一 结 点 ， 那 么 它 是 不 可 约 的 (irreducible)。 

图 9-19 给 出 可 以 用 于 测试 可 约 性 并 构建 结构 数据 流 算法 的 一 对 转换 。T 消 除 从 一 个 结 点 返回 自身 的 
自 循环 边 。 此 图 给 出 作用 于 b 的 T,， 记 作 7T,(5)。T 把 只 有 一 个 前 驱 a 的 结 点 b 生 入 回 a; 它 消除 边 <a，b> 并 
使 a 成 为 原来 离开 b 的 所 有 边 的 源头 。 如 果 这 一 过 程 留 下 多 个 从 a 到 某 个 结 点 n 的 边 ， 那 么 T, 合 并 这 些 边 。 
此 图 给 出 作用 于 a 和 4b 的 T,， 记 作 T,(a，b)。 任 意 通过 反复 运用 7T. 和 7 能够 归 约 成 单一 结 点 的 图 都 被 认为 是 


“可 归 约 的 "。 
G) © @) 
D-o $-9 


Tı (b) T,(a,b) 
图 9-19 TAMT, 


为 了 理解 这 是 如 何 工作 的 ， 考 虑 我 们 的 例子 的 CEFG。 图 9-20 给 出 把 这 个 CFG 归 约 成 单一 结 点 图 的 一 
个 T, 和 7T, 的 使 用 序列 。 这 一 序列 反复 运用 T,，， 直 到 不 再 存在 机 会 : TB, B). T,(B3, Bs). TB;, Bs). 
T,(B;, By). T,(B,, B) 和 7T,(B1，B1)。 接 下 来 ， 它 使 用 7T1(B,) WRAN, HARET, B) 完成 归 约 。 
因为 这 一 序列 把 这 一 图 归 约 成 单一 结 点 ， 所 以 原来 的 图 是 可 约 的 。 

其 他 的 运用 顺序 也 可 约 化 此 图 。 例 如 ， 从 T2(8,，B,) 开始 导致 一 个 不 同 的 转换 序列 。T, 和 7T, 有 有 限 
Church-Rosser 性 质 ， 这 一 性 质 确保 最 后 的 结果 与 运用 顺序 无 关 且 转换 序列 终止 。 因 此 ， 分 析 器 可 以 适时 
地 运用 T, 和 Ts 寻找 图 中 可 以 使 用 其 一 的 地 方 ， 并 利用 这 一 发 现 。 
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图 9-7 的 示例 图 
Bg Bs Be 
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B => B, == B B == B, = B, B = B == B 
图 9-9 的 示例 图 


图 9-20 示例 图 的 归 约 序列 


图 9-20 的 下 半 部 分 给 出 归 约 图 9-9 中 的 图 的 一 个 尝试 。 分 析 器 使 用 T2(B。，B;) 并 在 其 后 跟着 T2(B。， 
Bs)。 然 而 ， 在 这 一 点 没有 剩余 结 点 或 结 点 对 能 够 成 为 7 或 T, 的 候选 者 。 因 此 ， 分 析 器 不 能 进一步 归 约 此 
图 。( 其 他 顺序 也 不 能 奏效 。) 此 图 不 可 归 约 到 单一 结 点 ， 它 是 不 可 约 的 。 

TT 和 Ts 对 此 图 为 约 的 失败 是 由 此 图 的 基本 性 质 所 致 。 此 图 是 不 可 约 的 ， 因 为 它 包含 一 个 循环 ， 这 一 
循环 有 在 不 同 结 点 进入 此 结 点 的 边 。 根 据 源 语言 ， 生 成 此 图 的 程序 有 一 个 带 有 多 个 信 口 的 循环 。 我 们 可 
以 在 这 个 图 中 看 到 这 一 点 ; 考 虚 由 B, 和 B, 形 成 的 律 环 。 这 个 循环 有 从 B;，、B。 和 Bs 进入 它 的 边 。 同 样 地 ， 
由 B, 和 Bs 形成 的 循环 也 有 从 Bl 和 B, 进 入 循环 的 边 。 

不 可 归 约 性 对 建筑 在 类 似 于 7T, 和 T 这 样 的 转换 的 算法 提出 一 个 严峻 的 问题 。 如 果 归 约 序列 不 能 产生 
单一 结 点 图 而 完成 轨 约 ， 那 么 这 一 方法 必须 或 者 报告 失败 ， 或 者 通过 分 离 一 个 或 多 个 结 点 修改 此 图 ， 或 
者 使 用 一 个 迭代 方法 来 解决 已 归 约 图 上 的 系统 。 在 结构 上 一 般 基于 归 约 流向 图 的 方法 局 限于 可 约 图 。9 


O 我们 通 篇 集中 精力 于 迭代 不 动 点 算法 。 我 们 强调 迭代 数据 流 分 析 ， 因 为 它 对 于 不 同 的 问题 和 不 同 的 图 是 健 
壮 的 。 因 为 它 是 一 个 不 动 点 定点 算法 ， 所 以 它 还 提供 (方法 上 的 ) 良好 的 连续 性 ， 这 可 以 追溯 到 第 2 章 中 的 
子 集合 构造 法 。 i 
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相反 ， 先 代 算 法 可 以 在 非 可 约 图 上 正确 地 工作 。 

为 了 把 不 可 约 图 转化 成 可 约 图 ， 分析 器 可 以 分 离 一 个 或 多 个 结 点 。 本 例 的 图 的 最 简单 的 分 离 复 制 必 
要 的 块 来 为 边 <B,，B,> 和 <B,，B;> 重 设 目标 。 这 创建 只 带 有 一 个 入 口 的 通过 8, 的 循环 。 在 原本 通过 8B 或 
B; 进 入 循环 的 路 径 上 ， 这 些 块 作为 这 一 循环 的 序言 执行 。 从 而 创建 一 个 可 约 图 ， 如 图 9-21 所 示 。B, 和 B， 
都 有 惟一 的 前 驱 。B, 有 五 个 前 驱 ， 但 却 形成 由 8,、B! 和 8B; 形 成 的 复杂 循环 的 惟一 人口 。 因 为 B81 和 B; 都 有 
惟一 前 驱 ， 所 以 这 一 循环 有 惟一 的 入 口 点 而 且 它 自身 是 可 约 的 。 结 点 分 离 产 生 一 个 可 约 图 ， 但 要 以 复制 
两 个 结 点 为 代价 。 


6 Be 
<a `~, <a N 
OZN | AN 
B, == B, == B, B, — B, —— B; 
sÍ SS 
分 离 前 分 离 后 


图 9-21 结 点 分 离 


实践 和 研究 表明 ， 不 可 约 图 很 少 出 现在 全 局 数据 流 分 析 中 。20 世 纪 70 年 代 结构 化 程序 设计 的 出 现 使 
得 程序 员 很 少 使 用 随意 的 控制 转换 ， 例 如 像 在 大 多 数 程序 设计 语言 中 存在 的 goto 语 句 。 结 构 化 循环 结构 
如 do、for、while 和 unti1 等 都 不 能 产生 不 可 约 图 。 然 而 ， 把 控制 转 出 循环 的 转换 (例如 ，C 语 言 中 的 
break 语 句 ) 创建 一 个 对 于 向 后 分 析 是 不 可 约 的 CFG 。( 因为 这 样 的 循环 有 多 个 出 口 ， 逆 向 CFG 也 有 多 个 
AF.) 同样 地 ， 不 可 约 图 可 能 更 经 常 地 出 现在 相互 递归 子 例 程 的 过 程 间 分 析 中 。 例 如 ， 手 工 编码 的 递 
妇 下 降 分 析 器 的 调用 图 很 可 能 有 不 可 约 子 图 。 幸 运 的 是 ， 选 代 分 析 器 能 够 正确 且 高 效 地 处 理 不 可 约 图 。 


9.4.2 过 程 间 分 析 


过 程 调用 给 全 局 数据 流 分 析 带 来 了 不 精确 性 。 当 编译 器 遇 到 一 个 过 程 调 用 ， 而 且 它 设 有 关于 被 调用 
过 程 的 详细 信息 时 ， 它 必须 假设 这 一 调用 有 最 坏 的 效应 。 例 如 ， 被 调用 过 程 可 能 修改 它 能 存 取 的 任意 值 : 
全 局 变量 、 引 用 调用 参数 以 及 周围 词法 作用 域 的 名 字 。 

事实 上 , 通常 过 程 行为 比 最 坏 的 假设 所 冀 涵 的 行为 要 好 得 多 。 为 了 避免 每 一 个 调用 场所 的 信息 丢 炎 ， 
编译 器 可 以 分 析 整 个 程序 并 记录 概括 了 各 个 调用 行为 的 信息 。 这 样 的 分 析 通 常 被 形式 化 为 过 程 间 数 据 流 
分 析 问 题 。 这 些 数据 流 问 题 类 似 于 相应 的 全 局 问题 。 取 代 控 制 流 图 ， 过 程 间 问 题 通常 使 用 调用 图 (call 
graph) ， 或 得 自 于 调用 图 的 一 个 图 。 调 用 图 的 结 点 表示 过 程 ， 边 表示 过 程 调用 。 如 果 P 多 次 调用 9， 那么 
每 一 次 调用 生成 调用 图 中 不 同 的 边 。 

1. 控制 流 分 析 

在 过 程 间 分 析 中 ， 编 译 器 必须 阐明 的 第 一 个 问题 是 调用 图 的 构建 。 对 于 最 简单 的 情况 ， 其 中 每 一 个 
过 程 调用 调用 一 个 已 知 的 过 程 ， 这 一 过 程 的 名 字 被 指定 为 一 个 文字 常量 ， 此 时 这 一 问题 是 直截了当 的 。 
一 旦 程序 员 使 用 过 程 值 变 量 ， 或 者 作为 参数 传递 过 程 ， 那 么 这 一 问题 就 变 得 更 加 复杂 

如 果 源 语言 只 允许 程序 员 把 过 程 作为 参数 传递 给 过 程 ， 那 么 可 以 通过 构建 一 个 近似 的 调用 图 并 在 这 
一 近似 的 图 中 传播 被 传递 过 程 的 名 字 ， 同 时 在 每 次 传播 中 增加 相应 的 边 ， 来 解决 这 一 问题 。 如 果 过 程 可 
以 从 调用 中 返回 ， 即 程序 员 可 以 编写 过 程 值 函数 ， 那 么 就 需要 更 加 复杂 的 分 析 。 最 后 ， 面 向 对 象 程序 设 
计 可 能 因 名 字 解 释 依赖 于 类 层次 分 析 收 集 的 运行 时 类 型 信息 而 进一步 使 调用 图 含混 不 清 。 


481 
a 
482 
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2. 概括 问题 

为 了 概括 过 程 调用 的 副作用 ， 编 译 器 可 以 计算 包含 调用 期 间 可 能 被 修改 或 被 引用 的 变量 的 集合 。 编 
译 器 可 以 使 用 这 些 “ 概 括 ”集合 来 取代 全 局 数据 流 分 析 中 对 调用 场所 的 最 坏 假 设 。 典 型 的 过 程 间 概 括 问 
题 是 可 能 修改 (may modify) 问题 ， 它 使 用 包含 执行 调用 的 可 能 被 修改 的 所 有 变量 名 字 的 集合 来 注释 每 
一 个 调用 场所 。 

可 能 修改 问题 是 最 简单 的 过 程 间 数 据 流 问 题 之 一 ， 但 是 它 却 展示 可 能 出 现 的 很 多 问题 。 这 一 问题 由 
以 下 方程 组 描述 : 


Mop(p) -aeuvenmo[ U unin oo) 
e=(p,q) 

其 中 e=(p，g) 是 调用 图 中 从 p 到 gq 的 一 个 边 ， 而 unbind.(q) 是 一 个 函数 ， 它 根据 对 应 于 e 的 调用 场所 的 绑 
定 把 4 中 的 名 字 映 射 到 p 中 的 名 字 。LOCALMOD 包 含 在 p 中 被 局 部 修改 的 变量 。 这 个 集合 是 在 p 中 定义 的 
名 字 集 合 与 严格 限制 于 p 中 的 那些 名 字 集 合 的 差 。 为 了 计算 被 从 p 到 4 的 特定 调用 可 能 修改 的 名 字 集 合 ， 
编译 器 取 MOD(g) 的 unbind， 并 将 在 通 向 q 的 入 口 处 保存 的 所 有 别名 添加 到 该 结果 中 。 类 似 公式 可 以 找到 
可 能 引用 (may reference) 集合 ， 它 包含 在 调用 中 可 能 被 引用 的 名 字 。 

MOD 信 息 可 以 显著 改进 全 局 分 析 的 结果 。 例 如 ， 对 调用 场所 所 做 的 最 坏 情 况 假设 促使 全 局 常量 传 
播 可 能 丢失 涉及 参数 和 全 局 变量 的 值 在 内 的 信息 。 简 单 的 MOD 分 析 可 以 给 出 哪 种 信息 可 以 安全 保留 。 


3. 过 程 间 常 量 传播 

当 全 局 变量 和 参数 的 已 知 常 量 值 在 调用 图 上 传播 时 ， 过 程 间 常 量 传播 跟踪 它们 。 从 概念 上 看 ， 这 一 
问题 类 似 于 全 局 常量 传播 ， 但 是 它 有 额外 一 层 复杂 性 。 过 程 间 常量 传播 必须 跨越 调用 图 的 各 边 传 播 值 ， 
它 必须 理解 可 能 出 现在 每 一 个 调用 的 绑 定 (包括 被 返回 值 的 值 )。 另 外 ， 它 必须 对 经 过 一 个 过 程 p 的 本 的 
过 程 体 的 值 的 传输 进行 建 模 : 从 p 的 入 口 ， 到 p 内 的 每 一 个 调用 场所 ， 到 p 返 回 的 任意 值 。 因 此 ， 这 一 问题 
的 过 程 内 成 份 比 概括 问题 更 复杂 ， 因 为 它 可 能 是 分 析 已 经 发 现 的 信息 的 函数 ， 而 不 是 一 个 不 变量 集合 。 

若干 编译 器 使 用 跳 转 函数 (jump function) 建 模 化 过 程 内 效应 。 编 译 器 构造 一 个 显 式 模型 ， 模 型 把 
过 程 入 日 (或 从 调用 返回 ) 处 的 已 知 常量 映射 到 在 其 他 调用 和 返回 的 常量 值 。 数 据 流 方程 包含 跳 转 函数 
的 特殊 调用 ; 在 传播 阶段 ， 分 析 器 在 必要 时 调用 它们 。 跳 转 函 数 的 实现 多 种 多 样 ， 从 在 分 析 期 间 不 发 生 
变化 的 简单 静态 近似 ， 通 过 小 的 参数 化 模型 ， 直 到 执行 完整 的 全 局 常量 传播 。 在 实践 中 ， 简 单 的 模型 似 
平 可 以 捕获 大 部 分 效应 ， 至 少 从 代码 改进 的 角度 看 是 这 样 的 。 

4. 指针 分 析 

歧义 性 的 内 存 引 用 干扰 优化 器 改进 代码 的 能 力 。 歧 义 性 的 一 个 主要 源头 就 是 基于 指针 的 值 的 使 用 。 
对 于 代码 中 的 每 一 个 指针 ， 指 针 分 析 的 目标 是 确定 它 可 能 引用 哪些 内 存 位 置 。 没 有 这 样 的 分 析 ， 编 译 器 
就 必须 假定 每 一 个 指针 可 以 引用 所 有 可 寻 址 值 ， 包 括 运行 时 在 堆 上 分 配 的 所 有 空间 、 有 显 式 地 址 的 所 有 
变量 以 及 作为 引用 调用 参数 而 被 传递 的 所 有 变量 。 

， 指 针 分 析 的 一 个 共同 形式 是 计算 POINTSTO 集 合 。 这 些 集 合 包 含 这 样 的 序 对 <name，object list>, 
其 中 object list 是 name 可 能 存 取 的 内 存 位置 的 列表 。 分 析 的 目标 是 缩小 object list。 例 如 ， 编 译 器 不 能 把 
歧义 性 值 保 存在 寄存 器 中 。 然 而 ， 如 果 分 析 显示 一 个 指针 精确 地 引用 一 个 对 象 ， 而 且 在 代码 的 某 个 区 域 
没有 指向 这 一 对 象 的 其 他 指针 ， 那 么 在 那个 区 域 ， 编 译 器 可 以 把 这 个 对 象 提升 到 一 个 寄存 器 中 。 

现今 已 有 很 多 计算 POINTSTO 集 合 的 技术 。 这 些 技术 因 它 们 在 一 个 过 程 内 的 有 逼近 行为 的 不 同 而 不 同 ， 
流 非 敏感 (flow-insensitive) 方法 忽视 过 程 内 的 控制 流 ， 而 流 孝感 (flow-sensitive) 方法 则 要 考虑 内 部 
的 控制 流 。 某 些 技术 通过 把 部 分 调用 图 的 路 径 与 每 一 个 事实 相关 联 来 跟踪 程序 中 的 上 下 文 。 优 化 器 可 以 
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比较 路 径 来 确定 两 个 事实 是 否 可 以 同时 成 立 。 因 为 流 敏感 性 和 上 下 文敏 感性 都 增加 分 析 的 代价 ， 所 以 研 
究 者 设法 量化 来 自 于 每 一 种 技术 的 利益 。 在 某 些 应 用 中 ， 流 非 敏 感 、 上 下 文 非 敏 感 的 信息 似乎 就 足够 了 。 
而 对 于 其 他 的 应 用 ， 更 复杂 的 分 析 所 带 来 的 精确 性 是 很 有 帮助 的 。 

伴随 引用 调用 形式 参数 的 使 用 产生 一 定 的 歧义 性 。 尽 管 可 以 使 用 更 一 般 的 POINTSTO 公 式 来 模型 化 
这 一 情况 ， 但 是 它 还 可 以 被 作为 一 种 复杂 的 概括 信息 来 处 理 。 这 一 方法 为 每 一 个 过 程 计算 一 个 别名 序 对 
(alias pair) 和 集合。 如 果 <x，y>EALIAS(p)， 那 么 在 茶 一 条 进入 p 的 路 径 上 ，x 和 y 可 能 引用 相同 的 位 置 。 

5. 另外 一 种 选择 : 内 联 

作为 过 程 间 分 析 的 另外 一 种 选择 ， 编 译 器 可 以 执行 内 联 替 换 (参见 8.7.2 节 )。 一 个 调用 场所 的 内 联 
展开 把 过 程 间 问 题 转化 成 全 局 问题 。 这 一 方法 很 有 吸引 力 ， 因 为 它 给 编译 器 设计 者 带 来 处 理 这 一 问题 的 
最 好 的 过 程 内 方法 。 然 而 ， 内 联 也 存在 潜在 的 问题 ， 包 括 代 码 增长 、 编 译 时 间 以 及 为 大 型 程序 生成 好 代 
码 的 困难 。( 特 别 是 内 联 后 的 代码 的 名 字 空 间 可 能 从 根本 上 上 比 原来 程序 的 名 字 空 间 大 。 这 可 能 引发 全 局 
分 析 的 空间 问题 以 及 全 局 寄存 器 分 配 的 溢出 问题 。) 

在 使 编译 器 的 知识 更 精确 的 前 提 下 ， 内 联 有 彻底 改进 代码 的 潜力 。 例 如 ， 在 面向 对 象 代码 中 ， 内 联 
通常 可 以 减 小 给 定 调用 场所 的 可 能 对 象 类 型 (类 ) 集合 的 大 小 。 这 可 以 消除 动态 调度 的 需求 ， 并 使 用 简 
单 的 过 程 内 控制 流 取代 动态 调度 。 这 消除 在 实现 面向 对 象 语言 中 所 面临 的 一 个 最 大 的 负荷 源头 。 这 对 有 
较 小 过 程 体 的 过 程 (方法 ) 来 说 特别 有 优越 性 ， 它 限制 负 效 应 的 可 能 性 。 


6. 重 编译 

一 旦 编 译 器 使 用 一 个 过 程 的 知识 来 优化 另 一 个 过 程 ， 那 么 结果 代码 的 正确 性 就 依赖 于 这 两 个 过 程 
的 状态 。 对 一 个 过 程 的 源 代码 的 一 系列 改变 可 能 会 改变 编译 器 曾 用 于 证 明 其 他 过 程 内 的 优化 的 安全 性 
时 所 用 的 事实 ， 当 这 一 情况 发 生 时 ， 编 译 器 必须 重 编译 使 用 了 不 合法 优化 的 代码 。 因 此 ， 使 用 过 程 间 
分 析 或 优化 的 系统 必须 密切 注意 这 一 问题 。 为 了 解决 这 一 问题 ， 编 译 器 必须 或 者 执行 重 编译 分 析 来 跟 
踪 过 程 间 数 据 流 集 合 的 变化 并 确定 这 些 变化 要 求 重 编译 的 位 置 ， 或 者 采用 一 个 结构 来 使 编译 器 避免 这 
样 的 问题 。 

重 编译 分 析 一 般 要 求 编译 器 跟踪 过 程 间 分 析 结果 中 的 变化 ， 并 识别 什么 时 候 这 些 变化 使 优化 变 得 不 
合法 。 对 于 编译 器 执行 的 每 种 过 程 间 分 析 ， 它 还 执行 发 现 重 编译 应 该 出 现 的 时 间 的 隐藏 分 析 。 这 增加 分 
析 量 ， 但 减少 编译 量 。 

另外 一 种 方法 是 为 每 一 次 编译 重新 优化 整个 程序 。 称 为 链接 时 优化 器 (link-time optimizer) 的 系统 
把 优化 和 代码 生成 的 部 分 推迟 到 整个 程序 显现 出 来 时 进行 。 因 为 其 结果 只 记录 在 可 执行 代码 内 ， 而 这 一 
可 执行 代码 在 下 一 次 编译 时 被 扔 掉 ， 所 以 这 一 策略 绕 开 重 编译 的 问题 。 这 一 方法 增加 可 执行 代码 的 每 一 
个 成 份 的 编译 和 优化 的 次 数 ， 但 是 它 避免 跟踪 重 编译 依赖 关系 的 复杂 性 。 


9.5 概括 和 展望 


大 多 数 优化 把 一 般 情 况 代码 裁剪 到 编译 代码 中 出 现 的 特定 上 下 文中 。 编 译 器 裁剪 代码 的 能 力 通常 受 
限于 它 对 程序 的 运行 时 行为 的 范围 的 知识 。 

数据 流 分 析 人 允许 编译 器 在 编译 时 对 程序 的 运行 时 行为 进行 建 模 ， 并 从 这 一 模型 中 提取 重要 、 特 定 的 
知识 。 已 经 提出 很 多 数据 流 问题 ， 本章 展 示 了 其 中 若干 问题 。 其 中 的 很 多 问题 有 导致 高 效 分 析 的 特征 。 
特别 地 ， 可 以 用 快速 迭代 框架 表示 的 问题 拥有 使 用 简单 挝 代 解 算 器 的 高 效 解 。 

静态 单一 赋值 形式 是 把 数据 流 信 息 和 控制 相关 性 信息 都 编码 到 程序 的 名 字 空 间 的 一 种 中 间 形 式 。 使 
用 SSA 形 式 通常 简化 分 析 和 转换 。 很 多 现代 转换 依赖 于 代码 的 SSA 形 式 。 
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本 章 注 释 


第 一 个 数据 流 分 析 的 荣誉 通常 被 给 予 20 世 纪 60 年 代 早期 在 贝尔 实验 室 的 Vyssotsky[325]。 在 原来 的 
FORTRAN 编 译 器 中 的 早期 工作 包括 控制 流 图 的 构造 法 和 为 了 估 测 执行 频率 在 CFG 上 进行 Markov 风 格 的 
分 析 [25]。 由 Lois Haibt 构 建 的 这 一 分 析 器 可 以 认为 是 一 个 数据 流 分 析 器 。 

使 用 tbi 操 作 记录 歧义 性 跳 转 线索 已 在 Rice 的 巨大 标量 编译 器 项 目 中 发 挥 了 很 好 的 作用 。 几 乎 所 有 
的 控制 转换 器 都 使 用 立即 形式 来 编码 ; 对 于 少数 需要 到 寄存 器 的 跳 转 的 情况 ， 前 端 生成 一 个 简洁 的 tb1 
集合 。 

Waterman 描 述 了 在 CFG 的 构造 法 中 等 待 槽 可 能 带 来 的 问题 [951。 相 关 的 问题 也 出 现在 过 程 间 调用 图 
的 构造 法 中 。 Ryder[295}, Callahan 等 [50] 以 及 Hall 和 Kennedy[170] 都 在 FORTRAN 程 序 的 相对 简单 的 框 
架 下 探讨 了 这 些 问题 。Shivers 在 Scheme 中 向 这 些 问题 发 起 了 进攻 [305]。 

迹 代 数据 流 分 析 已 得 到 很 好 的 研究 。 在 关于 这 一 课题 的 编译 文献 中 ， 最 有 影响 的 论文 是 Kildall 在 
1973 年 所 写 的 论文 [212]、Hecht 和 Ullman 的 协同 工作 [177] 以 及 Kam 和 Ullman 所 写 的 两 篇 论文 [199,200]。 
本 章 的 处 理 方式 依据 Kam 的 工作 。 

本 章 集中 精力 讨论 迭代 数据 流 分 析 。 人 们 提出 了 很 多 其 他 的 解决 数据 流 问 题 的 算法 [207]。Kennedy 
的 路 径 列表 算法 预计 算 访问 结 点 的 顺序 [205]。 有 兴趣 的 读者 应 该 研究 一 下 结构 化 技术 ， 包 括 区 间 分 析 
[015，17，56]、7T) -7 分 析 [323，176]、Graham-Wegman 算 法 [163 ，164] 、 平 衡 树 、 路 径 压 缩 [318，319]、 


”图 文法 [208] 以 及 分 割 变 量 技术 [342] 。 


在 文献 中 ,支配 具有 很 长 的 历史 。Prosser 在 1959 年 引入 了 支配 ， 但 他 没有 给 出 计算 支配 者 的 算法 
[208]。Lowry 和 Medlock 描 述 了 用 于 他 们 的 编译 器 中 的 这 一 算法 [243]; 这 一 算法 的 费时 至 少 是 O(N”)， 其 
中 入 是 过 程 中 语句 的 数量 。 有 几 位 作者 基于 从 CFG 中 消除 结 点 开发 出 更 快 的 算法 [9，3，281]。Tarjan 提 
出 基于 深度 优先 搜索 和 合并 寻找 的 O(N logN+ E) 算法 [317]。Lengauer 和 Tarjan 改 进 了 这 一 算法 时 间 边界 
[235]， 其 他 人 也 一 样 [172，22，55]。 支 配 者 的 数据 流 公式 是 从 Aleen[13 ，16] 那 里 得 来 的 。 和 迭代 支配 的 
快速 数据 结构 来 自 于 Cooper、Harvey 和 Kennedy 的 一 篇 尚未 发 表 的 论文 。 图 9-10 中 的 算法 取 自 Ferrante、 
Ottenstein 和 Warren[138] 。 o o’ 

SSA 构 造 法 基于 Cytron 等 的 工作 [104]。 而 他 们 的 工作 是 建筑 在 Shapiro Saint[303]、Reif[284，320]、 
Ferrante、Ottenstein 和 Warren[38] 的 工作 之 上 的 。9.3.3 节 中 的 算法 构建 半 剪 枝 SSA 形 式 [46]。 重 命名 算法 
和 重新 构造 可 执行 代码 的 算法 的 详细 内 容 是 Briggs 等 [47] 给 出 的 。 由 临界 边 引起 的 复杂 性 很 早 就 受到 了 
优化 文献 的 重视 [293，124，119，121，215]; 我 们 不 应 对 它们 还 出 现在 从 SSA 翻 译 为 可 执行 代码 的 翻译 
中 而 感到 惊讶 。 

IBM PL/I 优 化 编译 器 是 执行 过 程 间 数据 流 分 析 的 一 个 最 早 的 系统 [313]。 关 于 副作用 问题 [31，29， 
96，97] 和 关于 过 程 间 常量 传播 问题 [62，105，329] 有 很 多 文献 。Burke 和 Torczon{57] 公 式 化 了 一 个 分 析 ， 
这 一 分 析 确 定 在 一 个 较 大 程序 中 哪些 块 必须 被 重 编译 以 反映 程序 的 过 程 间 信息 的 变化 。 指 针 分 析 本 质 士 
属于 过 程 间 分 析 ; 有 很 多 文献 对 此 做 了 描述 [330，187, 72, 228, 75, 115, 129, 333, 302, 180, 106, 
181]。Ayers、Gottlieb 和 Schooler 描 述 了 一 个 实用 系统 ， 访 系统 分 析 和 优化 整个 程序 的 某 个 子 集 [24]。 


第 10 章 
标量 优化 


10.1 概述 


编译 器 中 的 代码 优化 通过 分 析 和 转换 来 试图 改变 编译 器 生成 的 代码 质量 。 第 9 章 详 细 讨 论 过 的 数据 
流 分 析 能 够 使 编译 器 发 现 转换 的 机 会 ， 并 能 证 明 运 用 转换 的 安全 性 。 然 而 ， 分 析 只 是 转换 的 前 奏 : 只 有 
编译 器 通过 重 写 代码 才能 改进 代码 的 执行 。 

数据 流 分 析 是 静态 分 析 中 典型 问题 的 统一 概念 框架 。 许 多 问题 可 以 看 作 是 数据 流 框架 问题 。 使 用 某 
种 通用 目的 解 算 器 可 以 解决 程序 中 显现 出 来 的 这 些 问题 实例 。 给 出 的 结果 可 以 是 注释 代码 的 某 种 形式 的 
事实 集合 。 有 了 时候 ， 可 以 把 分 析 的 信息 直接 编码 成 代码 的 芒 形 式 ， 正 如 SSA 形 式 所 做 的 那样 。 

遗憾 的 是 ， 优 化 不 存在 统一 的 结构 框架 ， 这 一 结构 框架 把 特殊 的 分 析 与 必要 的 重 写 相 结合 以 达到 理 
想 的 改进 。 优 化 消耗 并 产生 编译 器 的 IR; 它们 可 以 被 看 成 是 复杂 的 重 写 引擎 。 某 些 优 化 被 作为 详细 的 算 
法 来 描述 ; 例如， 基于 支配 者 的 值 编号 组 建 来 自 低层 次 细节 的 事实 集合 (参见 8.5.2 节 )。 而 另外 一 些 优 
化 则 通过 高 层次 描述 来 说 明 ; 例如 ， 全 局 宛 余 消除 从 数据 流 方 程 集 开 始 操作 〈 参 见 8.6 节 ) ， 而 内 联 替 换 
通常 被 描述 为 使 用 适当 的 实 参 替换 形 参 并 使 用 替换 后 的 被 调用 过 程 的 文本 取代 调用 场所 (参见 8.7.2 节 )。 
用 于 描述 和 实现 转换 的 技术 多 种 多 样 。 

现代 编译 器 中 的 优化 器 一 般 被 构造 成 一 系列 过 滤器 。 每 一 个 过 滤器 ， 即 遍 ， 以 代码 的 态 形 式 为 输入 。 
作为 它 的 输出 每 一 个 遍 生 成 代码 的 IR 形 式 的 重 写 版 本 。 优 化 器 的 这 种 结构 因 若 干 实际 原因 而 得 以 发 展 。 
它 把 实现 分 解 成 较 小 的 片段 ， 避 免 在 较 大 、 集 成 的 程序 中 所 出 现 的 某 些 复杂 性 问题 。 这 种 结构 允许 遍 的 
独立 实现 和 测试 ， 从 而 简化 开发 、 测 试 和 维护 。 他 人 允许 编译 器 通过 在 各 层次 激活 不 同 的 遍 来 提供 不 同 层 
次 的 优化 。 某 些 遍 只 执行 一 次 ; 而 其 他 遍 可 能 在 一 个 序列 中 执行 多 次 。 

于 是 ， 优 化 器 设计 中 的 一 个 重要 问题 就 是 选择 要 实现 的 一 组 遍 以 及 运行 这 些 遍 的 顺序 。 遍 的 选择 决 
定 在 下 程序 中 发 现 哪样 特定 的 低 效 性 ， 以 及 为 了 缓解 或 消除 这 一 低 效 性 如 何 改进 代码 。 执 行 顺序 决定 遍 
之 间 相 互 作用 的 方式 。 

例如 ， 在 适当 的 上 下 文 (rz> 0 且 rs=4) 中 ， 优 化 器 可 能 把 mult r，。，rs=>riy 重 写 为 1shiftl rz; 
2 二 rl;。 这 通过 减 小 对 寄存 器 的 需求 并 使 用 更 廉价 的 操作 1shiftI 取 代 成 本 高 昂 的 操作 mu1t 来 改进 代码 。 
在 多 数 情况 下 ， 这 是 有 益 的 。 然 而 ， 如 果 下 一 个 遍 依 赖 于 交换 性 来 重新 组 织 表达 式 ， 那 么 使 用 移 位 取代 
乘法 则 消除 了 一 个 机 会 (乘法 是 可 交换 的 ;而 移 位 是 不 可 交换 的 )。 在 某 种 程度 上 ， 它 降低 后 面 遍 的 效 
率 ， 而 且 它 可 能 损害 整个 代码 的 质量 。 推 迟 移 位 对 乘法 的 取代 可 以 避 开 这 一 问题 ; 证 明 这 一 重 写 的 安全 
性 和 高 效 性 所 需 的 上 下 文 则 可 以 在 中 间 的 遍 中 存留 下 来 。 

有 时 候 ， 优 化 器 应 该 多 次 重复 一 个 遍 。 例 如 ， 消 除 死 代码 ， 或 无 用 代码 使 编译 器 在 几 个 方面 受益 。 它 
缩小 及 程序 ， 所 以 后 面 的 遍 需 要 处 理 更 少 的 代码 。 它 消除 某 些 定义 和 使 用 ， 所 以 它 可 以 使 数据 流 分 析 的 结 
果 更 加 明确 。 最 后 ， 它 通过 消除 执行 无 用 操作 来 改进 结果 代码 ， 这 才 是 它 的 真实 目的 。 因为 前 两 个 效应 ， 
死 代 码 消 除 通常 在 编译 的 早期 运行 。 为 了 得 到 最 后 的 效应 ， 它 应 在 编译 后 期 运行 。 已 知 有 些 遍 使 代码 无 用 ， 
所 以 死 代 码 消 除 还 可 能 在 这 样 的 遍 之 后 运行 。 因 此 ， 编 译 器 通常 在 编译 期 间 运 行车 干 次 死 代 码 消 除 。 
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| 作为 软件 工程 的 优化 


| 拥有 独立 的 优化 器 可 以 简化 编译 器 的 设计 和 实现 。 这 样 的 优化 器 简化 前 端 ; 它 可 以 生成 通用 目 | 
的 的 代码 并 忽视 特殊 情况 。 这 样 的 优化 器 简化 后 端 ; 它 可 以 集中 精力 于 把 程序 的 IR 版 本 映射 到 目标 | 
| 机器。 没有 优化 器 ， 前 端 和 后 端 都 必须 参与 寻找 并 开拓 改进 机 会 。 


| 在 遍 结 构 式 的 优化 器 中 ， 每 个 遍 包 含 一 个 转换 以 及 支持 这 一 转换 的 分 析 。 在 原理 上 ， 优 化 器 所 | 
| 执行 的 每 一 个 任务 都 可 以 只 实现 一 次 。 这 提供 了 单一 控制 点 ， 并 使 编译 器 设计 者 只 实现 一 次 复杂 的 | 
功能 ， 而 不 是 多 次 实现 复杂 的 功能 。 例 如 ， 从 耻 中 删除 一 个 操作 可 能 很 复杂 。 如 果 这 个 被 剧 除 的 操 | 
作 使 得 一 个 基本 块 为 空 ( 除 了 块 结束 分 支 和 跳 转 之 外 )， 那 么 转换 还 应 该 删除 这 个 块 并 适当 地 把 这 | 
| 个 块 的 前 驱 与 其 后 继 重新 相连 。 把 这 一 功能 分 离 出 来 可 以 简化 实现 、 理 解 和 维护 。 

从 软件 工程 的 角度 看 ， 带 有 清晰 的 责任 分 离 的 遍 结 构 是 有 意义 的 。 它 使 每 个 遍 只 集中 于 一 个 任 | 
务 。 它 提供 清晰 的 责任 分 离 ， 值 编号 忽视 寄存 器 的 压力 ， 而 寄存 器 分 配器 忽视 公共 子 表达 式 。 它 使 | 
编译 器 设计 者 独立 、 全 面 地 测试 各 遍 ， 而 且 它 简化 错误 隔离 。 





本 章 精 选 -组 转换 。 在 10.2 节 ， 我 们 围绕 着 转换 的 分 类 学 将 这 些 内 容 组 织 起 来 。10.3 节 给 出 在 其 他 
章节 中 没有 得 到 很 好 陈述 的 转换 类 型 的 部 分 优化 示例 。 高 级 话题 一 节 简 要 讨论 四 个 主题 : 组 合 优化 以 获 
得 更 好 的 结果 、 操 作 符 强度 减弱 、 以 速度 以 外 的 其 他 性 能 为 目标 的 优化 以 及 优化 序列 的 选择 。 


10.2 转换 分 类 


构建 优化 器 的 第 一 个 障碍 是 概念 上 的 障碍 。 关 于 优化 的 文献 描述 上 百 种 改进 芒 程 序 的 算法 。 编 译 器 
设计 者 必须 选择 这 些 转换 的 一 个 子 集 来 使 用 。 阅 读 原 始 论文 对 这 一 目的 没有 太 大 的 帮助 ， 因 为 多 数 作者 
都 推荐 使 用 他 们 自己 的 转换 。 

为 了 组 织 优化 空间 ， 我 们 使 用 一 个 简单 的 分 类 法 来 通过 各 转换 对 代码 的 效应 对 转换 进行 分 类 。 分 类 
必然 是 近似 的 。 例 如 ， 有 些 转 换 有 多 种 效应 。 在 高 层次 上 ， 我 们 把 转换 分 成 两 个 范畴 : 机 器 无 关 转 换 和 
机 器 相关 转换 。 

机 器 无 关 转 换 (machine-independent transformation) 是 那些 在 很 大 程度 上 忽视 目标 机 器 细节 的 转换 。 
在 多 数 情况 下 ， 转 换 的 效益 实际 上 依赖 于 详细 的 机 器 相关 论题 ， 但 是 这 类 转换 的 实现 却 忽 视 这 些 细节 。 

例如 ， 当 局 部 值 编 号 找到 一 个 元 余 的 计算 时 ， 它 使 用 一 个 引用 取代 这 个 元 余 的 计算 。 这 消除 一 个 计 
A, 但 它 也 许 增加 对 寄存 器 的 需求 。 如 果 增 加 需求 迫使 寄存 器 分 配器 把 某 个 值 移出 到 内 存 的 话 ， 那 么 内 
存 操作 的 代价 可 能 超过 消除 一 个 操作 所 带 来 的 成 本 节约 。 然 而 ， 值 编号 却 有 意 忽 视 这 种 效应 ， 因 为 它 不 
能 精确 地 确定 一 个 值 是 否 一 定 要 被 移出 。 

机 器 相关 转 接 (machine-dependent transformation) 是 那些 明确 考虑 目标 机 器 细节 的 转换 。 很 多 这 
样 的 转换 属于 代码 生成 领域 ， 在 这 一 领域 中 ， 编 译 器 把 代码 的 了 蕉 形式 映射 到 目标 机 器 上 。 然 而 ， 某 些 机 
器 相关 转换 则 属于 优化 器 的 范畴 。( 但是， 大 部 分 内 容 已 超出 本 章 的 范畴 。 ) 其 中 的 例子 包括 这 样 的 转换 : 
重 排 代码 来 改进 缓冲 的 行为 或 设法 揭示 指令 级 并 行 。 

尽管 这 两 个 范畴 间 的 区 分 在 某 种 程度 上 是 人 为 的 ， 但 是 这 一 区 分 长 期 以 来 一 直 被 用 作 转 换 的 第 一 级 
分 类 。 


10.2.1 机 器 无 关 转 换 
事实 上 ,编译 器 能 够 改进 程序 的 机 器 无 关 方 法 很 有 限 。 我 们 考虑 图 10-1 所 示 的 五 个 效应 。 它 们 是 : 
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机 器 无 关 
消除 无 用 代码 和 消除 元 余 
不 可 达 代 码 值 编号 
消除 无 用 代码 惰性 移动 
消除 不 可 达 代 码 公共 子 表达 式 消除 
代数 等 式 
特 化 
常量 传播 
强度 减弱 
罕 孔 优化 
代码 移动 允许 其 他 转换 
情 性 代码 移动 循环 展开 
提升 循环 反切 换 
常量 传播 重复 
代数 重 分 配 


图 10-1 机 器 相关 转换 


.消除 无 用 和 不 可 达 代码 : 如 果 编译 器 能 够 证 明 一 个 操作 或 者 是 无 用 的 或 者 是 不 可 达 的 ， 那 么 它 就 可 
以 消除 这 个 操作 。 其 方法 包括 无 用 代码 消除 和 不 可 达 代 码 消除 (参见 10.3.1 节 )、 代 数 等 式 简化 
(8.32 节 中 的 局 部 值 编号 的 一 部 分 ) 和 发 现 和 消除 某 种 不 可 达 代码 的 稀 朴 条 件 常量 传播 (10.4.1 节 )。 
。 把 一 个 操作 移 到 执行 频率 较 低 的 地 方 : 如 果 编 译 器 可 以 找到 一 个 地 方 ， 在 这 里 一 个 操作 的 执行 频 
率 较 低 且 产生 相同 的 答案 ， 那 么 它 可 以 把 这 个 操作 移 到 那里 。 其 方法 包括 惰性 代码 移动 (参见 
10.3.2 节 ) 和 常量 传播 (参见 9.2.4 节 、10.3.3 节 和 10.4.1 节 )， 常 量 传播 方法 把 运行 时 计算 移 到 编译 
时 进行 。 

. 特 化 计算 : 如果 编译 器 能 够 了 解 一 个 操作 执行 的 特定 上 下 文 的 话 ， 那 么 它 常常 可 以 相对 于 这 一 上 
下 文 来 特 化 操作 的 代码 。 其 方法 包括 操作 符 强度 减弱 (参见 10.4.2 节 )、 常 量 传播 (参见 9.2.4 节 、 
10.3.3 节 和 10.4.1 节 ) 以 及 罕 孔 优化 〈 和 参见 11.4.1 节 )。 

“激活 其 他 转换 : 如 果 编 译 器 能 够 以 某 种 方式 重 排序 代码 以 便 为 其 他 转换 揭示 更 多 机 会 ， 那 么 它 可 
以 改进 优化 的 整体 效应 。 其 方法 包括 内 联 共 换 (参见 8.7.2 节 )、 复 制 (参见 8.7.1 节 和 12.4.2 节 ) 以 
及 代数 重组 (参见 10.3.4 节 )。 

。 消 除 宛 余 计算 : 如 果 编 译 器 能 够 证 明 一 个 计算 是 宛 余 的 ， 那 么 它 可 以 使 用 对 前 面 已 经 计算 的 值 的 
引用 替换 这 个 宛 余 计算 。 其 方法 包括 局 部 值 编号 (参见 8.3.2 节 )、 超 局 部 值 编号 (参见 8.5.1 节 )、 
基于 支配 者 的 值 编号 (参见 8.5.2 节 ) 以 及 全 局 公共 子 表达 式 消除 (参见 8.6 节 )。 

我 们 已 经 看 到 了 每 个 范畴 的 优化 。10.3 节 将 更 加 充分 地 给 出 转换 分 类 中 的 机 器 无 关 转 换 ， 展 示 除 宛 

余 消 除外 每 一 个 范畴 的 更 多 优化 ， 而 宛 余 消除 已 在 第 8 章 得 到 了 相当 深入 的 探讨 。 

有 些 技术 适合 于 多 个 范畴 。 情 性 代码 移动 既 可 以 达到 代码 移动 的 目的 ， 又 可 以 达到 宛 余 消除 的 目的 。 
常量 传播 可 以 达到 某 种 形式 的 代码 移动 的 目的 ， 它 把 操作 从 运行 时 移 到 编译 时 ， 又 可 以 达到 特 化 的 目的 。 

它 至 少 以 一 种 形式 (参见 10.4.1 节 ) 区 分 和 消除 某 种 不 可 达 代码 。 
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10.2.2 机 器 相关 转换 


在 机 器 相关 转换 中 ， 编 译 器 能 够 开发 的 效应 受到 更 多 的 限制 。 它 可 以 : 

。 利 用 特殊 的 硬件 特性 : 通常 ， 处 理 器 设计 者 把 他 们 相信 对 程序 执行 有 帮助 的 特性 包含 到 处 理 器 中 。 
这 样 的 特性 包括 特 化 了 的 操作 ， 如 绕 过 缓冲 层次 的 装 和 操作、 告知 分 支 预测 硬件 不 跟踪 其 结果 的 
分 支 操作 ， 或 咨询 预 取 操作 。 如 果 编 译 器 能 够 有 效 地 利用 这 些 特性 ， 那 么 它们 的 确 可 以 加 速 程序 

496 的 执行 。 识 别 利用 这 些 特性 的 机 会 通常 需要 额外 的 工作 。 编 译 器 设计 者 也 许 给 优化 器 增加 新 的 转 
换 ， 或 使 用 更 复杂 的 指令 筛选 过 程 。 其 中 的 某 些 工作 属于 在 第 11 章 深入 描述 的 指令 筛选 领域 。 

"管理 或 隐藏 等 待 时 间 : 在 某 些 情况 下 ， 编 译 器 可 以 以 某 种 方式 管理 最 终 代 码 以 便 隐 藏 某 些 操作 的 
等 待 时 间 。 例 如 ， 内 存 操作 可 能 有 几 十 个 乃至 几 百 个 周期 的 等 待 时 间 。 如 果 目 标 机 器 或 者 支持 预 
取 操 作 或 者 支持 无 阻塞 装 入 ,那么 编译 器 也 许 会 找到 一 种 调度 在 内 存 操 作 的 使 用 之 前 发 行 这 一 内 
存 操作 ， 以 此 来 隐藏 等 待 时 间 。 重 新 排序 一 个 循环 或 一 组 代 套 循环 的 迭代 顺序 ， 或 改变 进入 内 存 
的 值 的 填充 都 可 以 改进 运行 时 缓冲 位 置 并 通过 减少 在 缓冲 中 委 失 的 内 存 操作 的 数量 来 帮助 管理 等 
待 时 间 。 第 12 章 详细 讨论 的 指令 调度 处 理 其 中 的 某 些 问 题 。 然 而 ， 编 译 器 设计 者 也 许 有 必要 增加 
直接 处 理 这 些 问 题 的 转换 。 

* 管理 有 限 机 器 资源 : 编译 过 程 中 的 复杂 性 的 另外 一 个 源头 来 自 于 目标 机 器 有 有 限 资 源 ， 包 括 寄 存 
器 、 功 能 单元 、 缓 冲 内 存 以 及 主 内 存 的 事实 。 编 译 器 必须 把 所 需 的 计算 映射 到 机 器 提供 的 有 限 资 
源 上 ， 并 且 当 这 一 计算 需要 的 资源 超过 可 用 资源 时 ， 编 译 器 必须 重 写 代码 以 减少 对 资源 的 需求 。 
例如 ， 寄 存 器 分 配 把 计算 值 映射 到 目标 机 器 的 寄存 器 单元 上 ; 第 13 章 详细 描述 这 一 问题 。 

图 10-2 给 出 本 分 类 的 机 器 相关 部 分 。 因 为 其 效应 的 每 一 个 例子 都 构成 单独 的 一 章 ， 所 以 我 们 将 它们 





从 本 章 中 省 略 。 
机 器 相关 
特殊 特征 等 待 资源 
指令 筛选 指令 调度 寄存 器 分 配 
图 10-2 机 器 相关 转换 
10.3 优化 示例 


本 节 描 述 我 们 认定 为 机 器 无 关 转 换 的 五 个 范畴 中 四 个 范畴 中 的 额外 优化 。 每 一 个 优化 都 试图 改进 标 
量 单 处 理 器 的 性 能 。 优 化 的 选择 是 示意 性 的 而 不 是 详尽 的 。 然 而 ， 每 一 个 转换 都 是 达到 与 机 器 无 关 转换 
范畴 相关 的 特定 效应 的 好 例子 。 


10.3.1 消除 无 用 和 不 可 达 代 码 


有 时 候 ， 一 个 程序 包含 没有 可 视 外 部 效应 的 计算 。 如 果 编 译 器 能 够 确定 一 个 给 定 操作 具有 这 样 的 性 
质 ， 那 么 它 就 可 以 从 这 一 程序 中 消除 这 一 操作 。 程 序 员 一 般 不 是 有 意识 地 创建 这 样 的 代码 。 然 而 ， 它 却 
作为 编译 器 优化 的 直接 结果 出 现在 大 多 数 程序 中 ， 而 且 常常 是 在 编译 器 前 端的 宏 展开 中 出 现 。 

两 个 不 同 的 效应 可 以 使 一 个 操作 符合 消除 的 条 件 。 这 样 的 操作 可 以 是 死 的 (dead) 或 无 用 的 
(useless ) ， 即 没有 操作 使 用 这 一 操作 的 结果 ， 或 其 结果 的 所 有 使 用 都 不 能 被 外 部 探知 。 这 一 操作 可 能 是 
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不 可 达 的 (unreachable)， 即 不 存在 包含 这 一 操作 的 有 效 控制 流 路 径 。 如 果 一 个 计算 属于 其 中 任意 一 个 
范畴 ， 那 么 它 可 以 被 消除 。 

消除 无 用 或 不 可 达 代码 生产 更 小 的 还 程序 ， 这 将 导致 更 小 的 可 执行 程序 和 更 快 的 编译 。 它 还 可 能 增加 
编译 器 改进 代码 的 能 力 。 例 如 ， 不 可 达 代码 可 能 存在 于 静态 分 析 的 结果 中 并 阻碍 某 些 转换 的 运用 。 在 这 种 
情况 下 ， 消 除 不 可 达 块 可 以 改变 分 析 结 果 并 允许 进一步 的 转换 (例如 ， 参 见 10.4.1 节 的 稀 政 条 件 常量 传播 )。 

元 余 消 除 的 某 些 形式 也 消除 无 用 代码 。 例 如 ， 局 部 值 编 号 运用 代数 等 式 来 简化 代码 。 例 子 包括 
x+0=>X、y x 1 二 y 和 max(zz) 二 z。 这 些 表 达 式 的 任意 一 个 都 消除 一 个 无 用 的 操作 ， 这 时 的 无 用 操作 指 的 
是 ， 消 除 这 个 操作 对 程序 的 外 部 可 视 行 为 不 会 带 来 任何 不 同 。 

本 节 的 算法 修改 控制 流 图 (CFG)。 因 此 ， 它 们 把 分 支 《cbr) wt (jump) 区 分 开 来 。 密切 注意 
这 一 区 分 有 助 于 读者 理解 本 节 中 的 算法 。 


1. 消除 无 用 代码 

消除 无 用 代码 的 经 典 算法 的 操作 方式 类 似 于 标记 清理 垃圾 回收 器 的 行为 方式 (参见 6.7.3 节 )。 同 标 
记 清 理 垃圾 回收 器 一 样 ， 它 们 在 代码 上 执行 两 遍 。 第 一 遍 从 消除 所 有 标记 域 并 标记 “关键 ”操作 开始 。 
一 个 操作 是 关键 的 (critical)， 如 果 它 为 过 程 设置 返回 值 ，9 它 是 一 个 输入 /输出 语句 ， 或 者 它 影响 从 这 
一 过 程 外 部 可 存 取 的 存储 位 置 中 的 值 。 关 键 操 作 的 例子 包括 过 程 入 口 块 和 出 口 块 以 及 对 其 他 过 程 的 调用 
的 代码 。 接 下 来 ， 算 法 向 前 跟踪 关键 操作 的 操作 数 到 它们 的 定义 ， 并 把 这 些 操作 标记 为 有 用 操作 。 这 一 
过 程 以 一 个 简单 的 工作 列表 和 挝 代 方 案 持 续 下 去 ， 直 到 再 没有 操作 可 以 标记 为 有 用 操作 。 第 二 人 遍 遍 历代 码 
并 消除 所 有 没有 被 标记 为 有 用 的 操作 。 

图 10-3 具 体 化 这 些 想法 。 我 们 称 为 Dead 的 算法 假设 代码 是 SSA 形 式 的 。 这 简化 上 述 过 程 ， 因 为 每 一 
次 使 用 引用 一 个 定义 。pead 由 两 个 遍 组 成 。 第 一 个 遍 称 为 WarkpPass， 它 发 现 有 用 操作 集合 。 第 二 个 遍 称 
为 SweepPass， 它 消除 无 用 操作 。HNarkpPass 依 赖 于 本 节 后 面 定义 的 反 向 支配 边界 。 


Dead() MarkPass() 
MarkPass() WorkList — @ 
SweepPass() for each operation i 
clear i's mark 
if i is critical then 
mark operation i 
WorkList — WorkList U {i} 
while (WorkList + 0) 
for each operation i remove i from WorkList 
if i is unmarked then (assume iis x +- y op z) 
if i is a branch then if def(y) is not marked then 
rewrite i with a jump mark def(y) 
to i's nearest marked WorkList — WorkList U {def(y)} 
postdominator if def(z) is not marked then 
mark def(z) 

WorkList — WorkList U {def(z)} 
for each block b € rpF(block()) 
let be the branch that ends b 

if j is unmarked then 
mark j 
WorkList  WorkList U {j} 


SweepPass() 


if i is not a jump then 
delete i 





图 10-3 无 用 代码 消除 


O ”这 一 情况 可 能 以 多 种 方式 发 生 ， 包 括 给 一 个 引用 调用 参数 赋值 、 通 过 一 个 未 知 指针 赋值 或 者 一 个 真实 的 返 
回 语句 。 
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除了 分 支 和 跳 转 之 外 ， 操 作 的 处 理 是 直截了当 的 。 标 记 阶 段 确定 一 个 操作 是 否 是 有 用 的 。 而 清除 阶 
段 消除 没有 被 标记 为 有 用 的 操作 。 

控制 流 操作 的 处 理 更 为 复杂 。 每 一 个 跳 转 都 被 认为 是 有 用 的 。 只 有 当 一 个 有 用 操作 的 执行 依赖 于 一 
个 分 支 的 存在 时 ， 这 一 分 支 被 认为 是 有 用 的 。 在 标记 阶段 发 现 有 用 操作 时 ， 它 还 标记 适当 的 分 支 为 有 用 
分 支 。 为 了 把 已 标记 操作 映射 到 该 操作 认为 有 用 的 分 支 上 , 这 一 算法 依赖 于 控制 相关 (control dependence) 
的 概念 。 

控制 相关 的 定义 依赖 于 后 支配 。 在 一 个 CFG 中 ， 结 点 j 后 支配 结 点 i:， 如 果 每 一 条 从 i 到 CFG 出 口 结 点 
的 路 径 都 通过 j。9S 使 用 后 支配 ,我 们 可 以 如 下 定义 控制 相关 性 : 在 一 个 CFG 中 ， 结 点 /与 结 点 控制 相关 ， 
当 且 仅 当 : 

1) 存在 一 条 从 i 到 /的 非 空 路 径 ， 使 得 j 后 支配 这 一 路 径 上 i 之 后 的 每 一 个 结 点 。 一 旦 执行 在 这 一 路 径 
上 开始 ， 那 么 这 一 执行 一 定 通 过 j 流 到 CFG 的 出 日 (根据 后 支配 定义 )， 而 且 ' 

2) j 结 点 不 严格 后 支配 i。 存 在 另 一 个 离开 i 的 边 ， 且 控制 可 以 沿 一 条 路 径 到 达 不 通 向 j 的 路 径 上 的 一 
个 结 点 。 一 定 存在 一 条 开始 于 那 条 边 ， 且 不 经 过 就 通 向 CFG 的 出 口 的 路 径 。 

换 句 话说 ， 有 两 条 或 多 条 边 离 开 块 i。 一 条 边 通 向 j， 而 另外 一 条 或 多 条 边 不 通 向 j。 因 此 ， 在 块 :的 
尾部 分 支 处 所 做 的 决策 可 以 决定 j 是 否 执行 。 如 果 j 中 有 一 个 操作 是 有 用 的 ， 那 么 i 的 尾部 的 分 支 也 是 有 
用 的 。 

控制 相关 的 概念 可 以 通过 j 的 反 向 支配 边界 RDF()) 来 精确 地 刻画 。 反 向 支配 边界 (reverse dominance 
frontier) 就 是 在 反 向 CFG 上 计算 的 支配 边界 。 当 MarkPass 把 一 个 操作 标记 为 有 用 时 ， 它 访问 包含 这 个 有 
用 操作 的 块 的 反 向 支配 边界 中 的 每 一 个 块 ， 并 把 这 个 块 的 块 结束 分 支 标记 为 有 用 。 当 它 标 记 这 些 分 支 时 ， 
它 把 这 些 分 支 加 到 工作 列表 中 。 

对 于 所 有 未 标记 分 支 ，5weepPass 使 用 到 包含 已 标记 操作 的 第 一 个 后 支配 者 的 跳 转 取 代 它 。 如 果 这 
个 分 支 没 有 被 标记 ， 那 么 它 的 后 继 ， 即 它 的 立即 后 支配 者 不 包含 有 用 操作 。( 否则 ， 当 这 些 操 作 被 标记 
时 ， 这 一 分 支 也 将 被 标记 。) 如 果 这 个 立即 后 支配 者 不 包含 已 标记 操作 ， 那 么 算法 运用 类 似 的 讨论 。 为 
了 找到 最 近 的 有 用 后 支配 者 ， 算 法 可 以 向 上 遍历 后 支配 者 树 ， 直 到 它 找到 包含 有 用 操作 的 块 。 因 为 根据 
定义 出 口 块 是 有 用 的 ， 所 以 这 一 搜索 一 定 停止 。 

Dead 运 行 后 ， 这 一 代码 不 包含 无 用 计算 。 它 可 能 包含 空 块 ， 而 这 个 空 块 可 以 通过 下 一 个 算法 消除 。 

2. 消除 无 用 控制 流 

优化 可 以 改变 程序 的 食 形 式 使 得 它 有 无 用 控制 流 。 如 果 编 译 器 包含 以 产生 无 用 控制 流 为 负 作用 的 优 
化 的 话 ， 那 么 编译 器 应 该 包含 通过 消除 无 用 控制 流 来 简化 CEG 的 遍 。 这 节 给 出 一 个 处 理 这 一 任务 的 称 为 
Clean 的 简单 算法 。 

Clean 在 CFG 上 使 用 四 个 转换 ， 如 图 10-4 所 示 。 这 些 转换 以 下 面 的 顺序 使 用 : 

1) 朋 入 元 余 分 支 。 如 果 C1ean 找 到 结束 于 分 支 的 块 ， 而 且 分 支 的 两 端 都 以 相同 块 为 目标 ， 那 么 
C1ean 应 该 使 用 到 目标 块 的 跳 转 取代 这 一 分 支 。 这 一 情况 是 作为 其 他 简化 的 结果 而 出 现 的 。 例 如 ，B, 也 
许 有 两 个 后 继 ， 每 一 个 都 带 有 一 个 到 8, 的 跳 转 。 如 果 另 一 个 转换 消除 这 些 块 的 所 有 计算 ， 那么 空 块 消除 
可 能 产生 如 图 10-4 第 1 部 分 所 示 的 初始 图 。 

2) 消除 空 块 。 如 果 Clean 找 到 一 个 只 包含 一 个 跳 转 的 块 ， 那 么 它 就 把 这 个 块 并 入 到 它 的 后 继 中 。 当 
其 他 遍 从 B, 消 除 所 有 操作 时 ， 就 会 出 现 这 种 情况 。 考 虑 图 10-4 第 2 部 分 中 的 初始 图 。 因 为 B, 只 有 一 个 后 继 
8B8;， 这 一 转换 为 从 进入 B; 的 边 重 定 目标 到 B;， 并 把 B; 从 Bj 的 前 驱 集 合 中 删除 。 这 简化 此 图 。 宅 也 应 该 加 快 


O 原文 中 这 里 是 i。 应 该 是 j。 一 一 译 者 注 
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执行 。 在 原 图 中 ， 通 过 B, 到 达 B, 的 路 径 需 要 两 个 控制 流 操作 。 在 转换 后 的 图 中 ， 这 些 到 达 B, 的 路 径 使 用 
一 个 操作 。 


-y 


2) 消除 空 块 


B, 


B; 
YN Y 
4) 提升 分 支 





图 10-4 Clean 中 使 用 的 转换 


3) 合并 块 。 如 果 C1ean 找 到 一 个 结束 于 到 8B 的 跳 转 的 块 B; 且 Bj 只 有 一 个 前 驱 ， 那 么 它 可 以 把 这 两 个 
块 合并 起 来 。 这 种 情况 以 多 种 方式 出 现 。 另 外 一 个 转换 可 能 消除 其 他 进入 B 和 的 边 ,或 者 B; 和 B, 也 许 是 又 
入 完 余 分 支 的 结果 (如 前 所 述 )。 无 论 哪 种 情况 ， 这 两 个 块 都 可 以 合并 成 一 个 块 。 从 而 消除 B, 的 尾部 的 
跳 转 。 

4) 提升 分 支 。 如 果 CJean 找 到 一 个 结束 于 到 空 块 3 的 跳 转 的 块 B 且 B 结 束 于 一 个 分 支 ， 那 么 C1ean 可 
以 使 用 B 的 拷贝 取代 结束 于 有 的 块 结尾 跳 转 。 实 际 上 ， 这 把 分 支 提升 到 Bi 中 。 当 其 他 遍 消 除 B 中 的 操作 而 
只 留 下 到 一 个 分 支 的 跳 转 时 ， 就 会 出 现 这 种 情况 。 转 换 后 的 代码 只 使 用 一 个 分 支 就 可 实现 相同 的 效应 。 
这 在 CFG 添 加 一 个 边 。 注 意 ，B, 不 能 是 空 的 ， 否 则 其 他 的 空 块 消除 将 消除 它 。 同 样 地 ，B, 不 能 是 8 的 惟 
一 前 驱 ， 否 则 其 他 CJean 将 合并 这 两 个 块 。( 提 升 后 ，B 仍 至 少 有 一 个 前 驱 。) 

实现 这 些 转换 需要 某 种 籍 记 。 某 些 修改 是 平凡 的 。 为 了 在 用 1LOC 和 图 式 CFG 表 示 的 程序 中 要 入 元 
余 分 支 ，Clean 使 用 一 个 跳 转 覆 写 这 个 块 的 尾部 分 支 ， 并 调整 这 些 块 的 后 继 和 前 驱 列 表 。 而 其 他 修改 则 
更 困难 。 合 并 两 个 块 可 能 涉及 为 合并 块 分 配 空间 、 把 操作 找 贝 到 新 块 中 、 调 整 新 块 的 前 驱 和 后 继 列表 
及 它 在 CFG 中 的 邻居 ， 以 及 丢弃 原来 的 两 个 块 。 

C1ean 以 一 种 系统 的 形式 运用 这 四 个 转换 。 它 后 序 遍 历 此 图 ， 这 样 B 的 后 继 在 8 之 前 被 简化 ， 除 非 这 
一 后 继 位 于 对 应 于 后 序 编号 的 后 边 上 。 对 于 这 种 情况 ，C7ean 将 在 访问 后 继 之 前 访问 前 驱 。 在 循环 图 中 
这 是 不 可 避免 的 。 在 前 驱 之 前 简化 后 继 减 少 实现 必须 移动 某 些 边 的 次 数 。 

在 某 些 情况 下 ， 可 以 使 用 多 个 这 样 的 转换 。 各 种 情况 的 详细 分 析 导 致 如 图 10-5 所 示 的 顺序 。 这 一 算 
法 使 用 一 系列 1f 语 句 ， 而 不 是 1f-then-else 语 句 ， 这 使 它 在 对 一 个 块 的 单一 访问 中 运用 多 个 转换 。 

如 果 CFG 包 含 后 边 ， 那 么 CJean 的 一 遍 可 能 会 创建 额外 的 机 会 ， 即 优化 沿 着 这 个 后 边 的 未 处 理 后 继 。 
而 这 些 后 继 可 以 创建 其 他 机 会 。 出 于 这 一 原因 ，CTean 选 代 式 地 重复 这 一 转换 序列 直到 CFG 停 止 变化 。 
它 必 须 在 对 0nePass 的 调用 之 间 计算 一 个 新 的 后 序 编号 ， 因 为 每 一 遍 都 改变 图 。 图 10-5 给 出 CJean 的 伪 
代码 。 

C1ean 不 处 理 可 能 出 现 的 所 有 情况 。 例 如 ， 它 不 可 能 依靠 自己 消除 一 个 空 循环 。 考 虑 图 10-6a 所 示 的 
CFG。 假 设 块 B 是 空 的 。Clean 的 任意 转换 都 不 能 消除 B,。B, 尾 部 的 分 支 不 是 元 余 的 。B, 不 结束 于 一 个 跑 


vA 
we 
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转 ， 所 以 C1ean 不 能 将 其 与 B; 合 并 。 它 的 前 驱 结 束 于 一 个 分 支 而 不 是 跳 转 ， 所 以 C1ean 既 不 能 合并 B2 和 Bi， 
HLA REFER AIS RAB, Hh. 


OnePass() 
for each block i, in postorder 


if i ends in a conditional branch then 
if both targets are identical then 
replace the branch with a jump 
if i ends in a jump to j then 
if i is empty then 
replace transfers to i with transfers to j 
if į has only one predecessor then 
coalesce i and j 
if j is empty and ends in a conditional branch then 
overwrite i's jump with a copy of j’s branch 


Clean() 
while the CFG keeps changing 
compute postorder 
OnePass( ) 





图 10-5 Clean 算 法 


然而 ，C1ean 和 Dead 间 的 合作 可 以 消除 空 循 环 。Dead 使 用 控制 相关 性 来 标记 有 用 分 支 。 如 果 BI 和 B， 
包含 有 用 操作 ， 而 B: 不 包含 有 用 操作 ， 那 么 Dead 中 的 标记 记 不 会 把 结束 B: 的 分 支 标 记 为 有 用 分 支 ， 因 为 
BERDF(B,)。 因 为 这 一 分 支 是 无 用 的 ， 所 以 计算 这 一 分 支 条 件 的 代码 也 是 无 用 的 。 因 此 ，Dead 消 除 B, 中 
的 所 有 操作 且 把 结束 B, 的 分 支 转化 成 一 个 到 它 最 近 的 有 用 后 序 支 配 者 B; 的 跳 转 。 这 消除 原来 的 循环 并 产 
生 如 图 10-6b 所 示 的 CFG。 

以 这 种 形式 ，C1ean 把 B 谷 入 Bi 中 ， 如 图 10-6c 所 示 。 这 也 使 中 尾部 的 分 支 成 为 元 余 分 支 。CJean 使 
用 一 个 跳 转 重 写 这 个 分 支 ， 产 生 如 图 10-6d 的 CFG。 在 这 一 点 ， 如 果 B 是 B; 惟 一 留 下 的 前 驱 ， 那 么 Clean 
将 把 这 两 个 块 合并 成 一 个 单一 块 。 


a) 源 图 b) 使 用 Dead 后 的 图 c) 移 除 B， d) BADR 
图 10-6 消除 空 循环 


这 一 合作 比 给 C7ean 增 加 处 理 空 循环 的 转换 更 简单 且 更 高 效 。 这 样 的 转换 可 能 识别 从 B, 到 其 自身 的 
分 支 ， 对 于 空 的 B， 使 用 到 这 一 分 支 的 其 他 目标 的 一 个 跳 转 重 写 B。 问 题 在 于 确定 什么 时 候 B; 真 正 为 空 。 
如 果 B 除 了 这 个 分 支 之 外 不 包含 其 他 操作 ， 那 么 计算 这 一 分 支 条 件 的 代码 必须 位 于 循环 之 外 。 因 此 ， 只 
有 自 循环 从 不 执行 时 这 一 转换 才 是 安全 的 。 推 断 自 循环 执行 的 次 数 需 要 比较 的 运行 时 值 的 信息 ， 这 一 工 
作 一 般 超出 编译 器 的 能 力 。 如 果 这 个 块 包含 操作 ， 但 只 是 控制 这 一 分 支 的 操作 ， 那 么 转换 将 需要 识别 模 
式 匹 配 的 情况 。 无 论 是 哪 一 种 情况 ， 新 的 转换 都 将 比 C1ean 中 的 四 个 转换 更 加 复杂 。 依 赖 于 Dead 和 (C71ean 
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的 合作 可 以 以 更 简单 、 更 模块 化 的 形式 达到 适当 的 结果 。 

3. 消除 不 可 达 代 码 

有 了 时候 ，CFG 包 含 不 可 达 代码 。 编 译 器 应 该 发 现 不 可 达 块 并 消除 它们 。 一 个 块 可 能 因为 以 下 两 个 原 
因 是 不 可 达 的 : CFG 中 不 存在 通 向 这 个 块 的 路 径 ， 或 者 达到 这 个 块 的 路 径 是 不 可 执行 的 。 例 如 ， 它 被 一 
个 总 是 评估 为 假 的 条 件 所 保护 。 

前 者 的 情况 比较 容易 处 理 。 编 译 器 可 以 在 CFG 上 执行 简单 的 标记 清理 式 的 可 达 性 分 析 。 从 入 口 开 始 ， 
编译 器 标记 这 一 CFG 中 每 一 个 可 达 结 点 。 如 果 所 有 的 分 支 和 跳 转 都 是 非 歧义 性 的 ， 那 么 所 有 未 标记 的 块 
都 可 以 删除 。 对 于 歧义 性 的 分 支 或 跳 转 ， 编 译 器 必须 保存 这 样 的 分 支 或 跳 转 可 能 达到 的 所 有 块 。 这 一 
分 析 简 单 且 廉 价 。 可 以 在 其 他 目的 的 CFG 遍 历 期 间或 在 CFG 本 身 的 构造 期 间 完成 这 一 分 析 工 作 。 

处 理 第 二 种 情况 更 加 困难 。 它 需要 编译 器 推断 控制 分 支 的 表达 式 的 值 。10.4.1 节 给 出 寻找 这 样 的 不 
可 达 块 的 算法 ， 通 向 这 些 块 的 路 径 是 不 可 执行 的 。 


10.3.2 代码 移动 


把 一 个 计算 移动 到 执行 频率 更 低 的 位 置 应 该 可 以 减 小 运行 程序 的 总 操作 计数 。 本 节 给 出 的 第 一 个 转 
换 ， 情 性 代码 移动 (lazy code motion) 使 用 代码 移动 来 加 速 执行 。 因 为 循环 往往 比 包围 它们 的 代码 执行 
的 次 数 更 多 ， 所 以 这 一 领域 的 大 部 分 工作 致力 于 把 循环 不 变量 表达 式 移 出 循环 。 惰 性 代码 移动 执行 循环 
不 变量 代码 的 移动 。 它 把 原本 在 可 用 表达 式 问 题 中 公式 化 了 的 概念 扩展 到 包含 沿 着 某 些 路 径 元 余 但 不 是 
在 全 部 的 路 径 元 余 的 操作 上 。 它 插入 代码 来 使 这 些 操作 沿 着 所 有 路 径 都 是 元 余 的 ， 并 消除 这 些 最 新 的 元 
余 表达 式 。 

然而 ， 有 些 编译 器 按 其 他 标准 进行 优化 。 如 果 编 译 器 关心 可 执行 代码 的 大 小 ， 那 么 它 可 能 考虑 减少 
特定 操作 的 拷贝 数目 的 代码 移动 。 本 节 给 出 的 第 二 个 转换 ， 提 升 (hoisting ) ， 使 用 代码 移动 来 减少 指令 
的 复制 。 它 发 现 这 样 的 情况 : 一 个 操作 的 插入 使 得 相同 操作 的 若干 拷贝 在 不 改变 程序 计算 的 值 的 前 提 下 
成 为 元 余 。 

1. 情 性 代码 移动 | | 

情 性 代码 移动 (LCM) 使 用 数据 流 分 析 来 发 现 作 为 代码 移动 候选 者 的 操作 以 及 可 以 放置 这 些 操作 的 
位 置 。 这 一 算法 操作 于 程序 的 IR 形 式 和 它 的 CFG， 而 不 在 SSA 形 式 上 操作 。 这 一 算法 由 6 个 数据 流 方程 
集合 和 把 结果 解释 为 修改 代码 的 指南 的 简单 策略 组 成 。 

LCM 把 代码 移动 与 元 余 及 部 分 元 余 计 算 的 消除 结合 起 来 。 元 余 性 在 第 8 章 中 做 过 介绍 。 一 个 计算 在 p 
处 是 部 分 元 余 的 ， 如 果 它 出 现在 达到 p 的 某 些 而 不 是 全 部 路 径 上 。 图 10-7 给 出 表达 式 可 能 是 部 分 元 余 的 
两 种 形式 。 在 第 一 个 例子 中 ，a<-b x c 出 现在 导向 汇合 点 的 一 条 路 径 上 而 不 在 另 一 条 路 径 上 。 为 使 第 二 
个 计算 元 余 ，LCM 在 另 一 条 路 径 上 插入 a<-b x c 的 评估 。 在 第 二 个 例子 中 ，a<-b x c 沿 着 循环 的 后 边 是 元 
余 的 ， 但 沿 着 进入 这 一 循环 的 边 不 是 元 余 的 。 在 循环 的 前 面 插入 a<-b x c 的 评估 使 得 循环 内 的 这 一 出 现 
是 元 余 的 。 通 过 使 循环 不 变量 计算 元 余 并 消除 它 ，LCM 把 不 变量 计算 移 到 循环 之 外 。 

为 了 实现 这 一 点 ， 优 化 器 求解 一 系列 数据 流 问 题 。 它 计算 有 关 可 用 性 (availability) 的 信息 ， 这 是 
在 8.6 节 熟知 的 向 前 数据 流 问 题 ， 并 计算 有 关 可 前 至 性 (anticipability) 的 信息 ， 这 是 作为 向 后 数据 流 问 
题 的 相关 概念 。 下 一 步 使 用 这 些 分 析 的 结果 计算 最 早 放 置 (earliest placement) ; 这 使 用 一 个 集合 注释 
每 一 条 边 ， 对 于 这 一 集合 中 的 表达 式 ， 这 个 边 是 合法 放置 且 在 图 中 没有 更 早 的 合法 放置 。 然 后 ， 算 法 寻 


O ”如 果 源 语言 包含 执行 指针 或 标签 上 的 算术 的 能 力 ， 那 么 每 一 个 块 都 必须 被 保存 。 否 则 ， 编 译 器 应 该 能 够 把 
被 保存 集合 限制 到 其 标签 已 被 引用 的 那些 块 上 。 


en 
© 
wa 
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找 可 能 的 较 晚 放置 (later placement)， 即 寻找 把 一 个 表达 式 从 它 的 最 早 放 置 在 CFG 向 前 移动 或 在 执行 向 
后 移动 ， 且 保持 它 产 生 与 最 早 放 置 有 相同 效应 的 位 置 。 最 后 ， 这 一 算法 为 每 个 边 计 算 刻 画 沿 着 这 条 边 插 
入 的 表达 式 的 插入 集合 (insertion set)， 并 为 每 一 个 结 点 计算 包含 从 该 块 消 除 的 表达 式 的 删除 集合 
(deletion set)。 一 个 简单 的 后 继 遍 解释 插入 集合 和 删除 集合 ， 并 重 写 IR。 





图 10-7 


(1) 背景 ”求解 数据 流 方程 的 第 一 步 是 为 每 一 个 块 计算 局 部 谓词 。LCM 使 用 三 种 局 部 信息 。 

1) DEEXPR(b)。 是 块 b 中 向 下 暴露 的 表达 式 e 的 集合 。 如 果 eEDEEXPR(b)， 那 么 在 块 b 的 尾部 对 e 的 
评估 所 产生 的 值 与 在 其 原来 位 置 的 评估 值 相同 。 

2) UEEXPR(b)。 是 块 b 中 向 上 暴露 的 表达 式 e 的 集合 。 如 果 eEUEEXPR(b)， 那 么 在 块 b 的 入 口 处 对 e 
的 评估 所 产生 的 值 与 在 其 原来 位 置 的 评估 值 相同 。 

3) EXPRKILL(b)。 是 在 块 b 中 被 杀 死 的 表达 式 e 的 集合 。 如 果 eEEXPRKILL(b)， 那 么 b 包 含 e 的 一 个 或 
多 个 操作 数 的 重 定 义 。 作 为 结果 ， 在 b 的 入 口 处 对 e 的 评估 与 在 b 的 尾部 对 它 的 评估 可 能 生成 不 同 的 值 。 
我 们 已 在 其 他 数据 流 问 题 中 使 用 过 这 些 集 合 。 

LCM 的 方程 依赖 于 若干 个 有 关 代码 形态 的 隐 含 假设 ,它们 假设 文本 相同 的 表达 式 总 是 定义 相同 的 名 字 ， 
这 一 假设 提出 名 字 的 无 限制 集合 ， 即 每 一 个 文本 上 不 同 的 表达 式 有 一 个 名 字 。( 这 是 5.6.1 节 中 描述 的 寄存 
器 命名 规则 中 的 规则 1。) 因为 .的 每 一 个 定义 来 自 于 表达 式 ri+rj 且 没有 其 他 表达 式 定义 r.， 所 以 优化 器 不 
需要 寻找 rtTrj 的 每 一 个 定义 ， 并 把 结果 拷贝 到 一 个 临时 位 置 以 供 后 期 使 用 。 之 后 ， 它 可 以 直接 使 用 r、。 

LCM 移 动 表 达 式 ， 而 不 是 移动 赋值 。 文 本 上 相同 的 表达 式 定义 相同 的 虚拟 寄存 器 的 要 求 意味 着 程序 
变量 是 由 寄存 器 到 寄存 器 的 拷贝 操作 设置 的 。 图 10-8 中 的 代码 具有 这 样 的 性 质 。 通 过 把 名 字 空 间 划 分 成 
变量 和 表达 式 ， 我 们 可 以 把 LCM 的 定义 域 限 制 到 表达 式 上 。 在 这 一 例子 中 ， 变 量 是 r:、rs 和 rs 中 的 每 一 
个 都 是 由 一 个 拷贝 操作 定义 的 。 所 有 其 他 名 字 ，rm、rs、rs、re、r、razo 和 ra 代表 表达 式 。 下 面 的 表 给 
出 本 例 中 各 块 的 局 部 信息 : 本 


Bi B: B; 


DEEXPR {ri, ras rs} {ry, rz0, ral 
UEEXPR (ri, rs} {re, Too. Tad 
EXPRKILL {rs, re, m} {rs, Te, ry} 
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(2) 可 用 表达 式 。LCM 的 第 一 步 是 计算 可 用 表达 式 。 
AVAILIN(n) = (| AVAILOUT(m), n# nm 
m € preds(n) 


AVAILOUT(m) = DEEXPR(m) U (AVAILIN(m) N EXPRKILL(m)) 


以 上 方程 的 形式 与 8.6 节 中 的 方程 形式 略 有 不 同 。 在 这 一 形式 中 ， 这 些 方程 为 每 一 个 块 的 入 口 和 出 口 分 
别 计算 不 同 的 集合 AVAILIN 和 AVAILOUT。8.6 节 中 的 AVAIL 集 合 与 这 里 的 AVAILIN 集 合 相 同 。 
AVAILOUT 集 合 表 示 一 个 块 对 其 后 继 的 AVAILIN 和 集合 的 贡献 。 这 一 解 算 器 必须 初始 化 AVAILIN(n0) 为 空 
集 ， 而 设置 AVAILIN 和 AVAILOUT 和 集合 为 包含 过 程 中 所 有 表达 式 的 集合 。 

对 于 图 10-8 中 的 例子 ， 可 用 性 方程 产生 下 面 的 结果 : 


By B, B, 
AVAILIN 0 {ris ra} {ri, ra} 
AVAILOUT {ri, r3, rs} {ry, rs, Tr, Tao, Pat 





在 金 局 元 余 消 除 中 ，xEAVAILIN(b) 表示 为 沿 着 从 m 到 的 每 一 条 路 径 ，x 被 计算 ， 而 且 它 的 任意 操 
作 数 都 不 在 x 被 计算 的 点 与 b 之 间 被 重新 定义 。 对 理解 LCM 有 帮助 的 另外 一 个 观点 是 ，xEAVAILIN(b) 当 
且 仅 当 编 译 器 可 以 把 x 的 评估 放置 在 b 的 入 口 处 ， 并 得 到 由 从 nw 到 5 的 任意 控制 流 路 径 上 的 最 新 近 评 估 产 
生 的 结果 。 就 此 而 论 ，AVAILIN 集 合 告知 编译 器 ， 忽 视 * 的 任意 使 用 ， 它 可 以 把 x 的 评估 在 CFG 中 向 前 移 
动 的 距离 。 


By: ToadI 1 => T1 
i2i ri => ry 人 } 
loadAl rp,@m => r3 7, Y20, 021 
i2i T3 => ra 表达 式 集合 
cmp_LT rz,ra => rs 
cbr rs 一 B2,B3 
: mult rysTa = Yeo 
add ri9gsT20 => T21 
i2i rzl => rg 
addi rz,1 = rs 
i2i re = rz 


cmp-GT r2.%4 > m7 


cbr Yr) 一 B3,Bz 





图 10-8 . 情 性 代码 移动 例子 


(3) 可 前 置 表达 式 。 可 用 性 为 LCM 提 供 有 关 在 CFG 中 把 评估 向 前 移动 的 信息 。LCM 还 需要 有 关 在 
CEFG 中 把 评估 向 后 移动 的 信息 。 为 了 得 到 这 一 信息 ，LCM 计 算 有 关 可 前 置 表达 式 (anticipable expression) 
的 信息 ， 即 在 CFG 中 可 以 比 它们 的 所 在 块 更 早 评估 的 表达 式 。 

UEEXPR 集 合 局 部 地 刻画 这 一 概念 。 如 果 eEUEEXPR(b) ， 那 么 至少 包含 e 的 一 个 评估 ， 而 且 这 一 
评估 使 用 在 b 的 入 口 之 前 定义 的 操作 数 。 因 此 ，eEUEEXPR(b) 列 含 着 e 在 b 的 入 口 处 的 评估 一 定 产生 与 5 
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中 的 e 的 第 一 次 评估 相同 的 值 ， 所 以 编译 器 可 以 安全 地 把 e 的 第 一 次 评估 移 到 块 2 的 和 人口 。 
LCM 的 第 二 个 数据 流 方程 集合 把 可 前 置 性 概念 推广 到 多 个 块 之 间 。 这 是 一 个 向 后 数据 流 问题 。 
ANTOUT(n)= () ANTIN(m), nn 
m € succ(n) 
ANTIN(m) = UEEXPR(m) U (ANTOUT(m) N EXPRKILL(M)) 


LCM 必 须 初始 化 m% 的 ANTOUT 集 合 为 空 集 ， 并 保留 ANTIN 和 ANTOUT 集 合 为 包含 这 一 过 程 中 所 有 表达 
式 的 集合 。 

ANTIN 和 ANTOUT 为 编译 器 提供 把 ANTOUT(2) 中 的 表达 式 向 后 移动 的 相关 信息 。 如 果 
xEANTOUT(b) ， 那 么 编译 器 可 以 把 x 的 评估 放置 在 块 b5 的 尾部 并 产生 与 离开 b 的 任意 路 径 上 的 下 一 次 评估 
相同 的 值 。 

对 于 我 们 的 例子 ， 可 前 置 性 方程 产生 下 面 的 结果 : 


B, -8 B; 


ANTIN {ri, r3} {rzo, Tart 0 
ANTOUT 0 8 0 


(4) 最 早 放 置 。 给 定编 码 在 CFG 中 向 前 移动 的 相关 信息 的 可 用 性 ， 以 及 编码 在 CFG 中 向 后 移动 的 相 
关 信 息 的 可 前 置 性 ， 编 译 器 能 够 为 每 一 个 表达 式 计 算 一 个 最 早 放 轩 (earliest placement)。 为 了 保持 方程 
简单 ， 把 计算 放置 到 CFG 的 边 上 而 不 是 结 点 处 要 更 容易 些 。 这 使 得 方程 在 不 选择 块 的 情况 下 计算 放置 。 
编译 器 可 以 推迟 做 如 下 决定 ， 把 操作 放置 到 边 的 源头 的 尾部 、 放 置 边 的 目的 地 的 开始 ， 还 是 在 边 的 中 间 
设置 新 块 。( 参 见 9.3.5 节 所 讨论 的 临界 边 的 概念 。) 

对 于 CFG 中 的 边 <i， 户 ， 表 达 式 e 在 EARLIESTG,， j) 中 当 且 仅 当 计算 可 以 合法 地 移 到 边 <i， 户 且 不 能 
移 到 CFG 中 任意 更 早 的 边 上 。EARLIEST 的 方程 反映 这 一 条 件 : 


EARLIEST(i, j ) = ANTĪN( j) N AVAILOUT(i) N (EXPRKILL(i) U ANTOUT(D) 


这 些 条 件 都 有 简单 的 解释 。 为 使 e 在 边 <i， 户 上 合法 且 在 CFG 中 不 能 进一步 向 上 移动 ， 下 面 的 三 个 条 件 必 
须 成 立 : . 

1) eEANTIN()) 证 明 编 译 器 可 以 把 e 移 到 /的 头 部 。 

2) efAVAILOUT(i) 证 明 在 i 的 出 口 处 没有 e 的 早 前 计算 是 可 用 的 。 如 果 eEAVAILOUT(i)， 那么 e 在 <i， 
户 上 的 计算 将 是 元 余 的 。 

3) eE(EXPRKILL(i)U ANTOUT() ) 证 明 e 不 能 穿 过 i 向 上 移动 到 更 早 的 边 。 如 果 eEEXPRKILL(i)， 
那么 e 将 在 块 的 头 部 产生 一 个 不 同 的 结果 ， 所 以 它 不 能 穿 过 i 向 上 移动 。 如 果 eE ANTOUT() 的 补 集 ， 那 
么 e 不 能 移 到 块 i 中 。 

因为 LCM 不 能 把 表达 式 移动 到 比 no 更 早 的 地 方 ， 所 以 对 于 i= no，LCM 应 该 忽视 最 后 一 
(EXPRKILL(i) U ANTOUT() )。 这 一 简化 略微 减 小 了 计算 EARLIEST 的 代价 。 

计算 EARLIEST 不 需要 迭代 ; 它 只 依赖 于 早 前 的 计算 值 。 进 而 ，EARLIEST 被 用 于 LATER 集 合 的 计 
算 中 。 因 为 LATER 计 算 需要 先 代 ， 为 每 个 边 预计 算 EARLIEST 和 集合 可 能 更 快 。 编 译 器 设计 者 也 可 以 把 
EARLIEST(i, j) 的 定义 的 右 端 向 前 替换 为 方程 中 的 下 一 个 集合 。 

对 于 我 们 的 例子 ，EARLIEST 计 算 产 生 下 面 的 集合 : 
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<B,, B,> <B,, B,> <B,, B,> <B,, B> 


EARLIEST {ra> Tard 0 0 6 


(5) 后 放置 。 在 达到 相同 效应 的 前 提 下 ，LCM 中 最 后 的 数据 流 问 题 是 确定 一 个 最 早 放置 是 否 可 以 在 
CFG 中 向 前 移动 。 
LATERIN = () LaTER(ij), j#no 
i€ pred(j) 
LATER(i, j) = EARLIEST(i,j) U LATERIN(i) n UEEXPR(i), ie pred(j) 


这 个 解 算 器 必须 初始 化 LATERIN(no) 为 空 集 。 

一 个 表达 式 eELATERIN(K)， 当 且 仅 当 达 到 k 的 每 一 条 路 径 包 含 一 个 边 <p ，g> 使 得 eEEARLIEST(p， 
9q)， 且 从 g 到 k 的 路 径 既 不 重新 定义 e 的 操作 数 也 不 包含 e 的 评估 (那个 较 早 放置 将 是 可 前 置 的 )。LATER 
方程 中 的 EARLIEST 项 保证 LATER(i, j) 包含 EARLIEST(i，j)。 如 果 e 可 以 从 i 开始 向 前 移动 
(eELATERIN(i)) 且 i 的 入 口 的 放置 不 前 置 ; 中 的 使 用 ， 那 么 这 个 方程 的 其 余部 分 把 e 放 到 LATER(i, j) 
中 。 

一 旦 这 一 方程 被 解 开 ， 那 么 eELATERIN(i) 意味 着 编译 器 可 以 穿 过 i 向 前 移动 e 的 评估 而 不 损失 任何 
利益 ， 即 在 i 中 不 存在 较 早 评 估 是 可 前 置 的 e 的 评估 ， 而 且 eELATER(i, j) 意味 着 编译 器 将 把 i 中 的 e 的 评 
估 向 前 移 到 j。 

对 于 我 们 的 例子 ， 这 些 方 程 产生 下 面 的 集合 : 





B, B, ' B, 
LATERIN 0 0 - 0 
<B,, B,> <B,, Bs> <B,, B,> <B,, B> | 
LATER {rzo, Pat 0 @ 0 


(6) 重 写 代码 。 执 行 惰 性 代码 移动 的 最 后 一 步 是 重 写 代码 使 得 它 利 用 得 自 于 数据 流 计算 的 知识 。 为 
了 简化 这 一 过 程 ，LCM 计 算 两 个 额外 的 集合 INSERT 和 DELETE。 
对 于 每 一 条 边 ，INSERT 集 合 指定 LCM 应 该 插入 这 条 边 上 的 计算 。 


INSERT( j ) = LATER(i, j ) N LATERĪN( j ) 


MRIRA—T, BALCMYUAM ABBA EAE. MRRA—THR, 那么 LCM 可 以 在 的 
入 口 插入 这 些 计算 。 如 果 上 述 两 个 条 件 都 不 成 立 ， 那 么 边 <i， 放 是 一 个 临界 边 ， 而 且 编 译 器 应 该 在 这 个 
边 的 中 间 插入 一 个 块 来 分 离 <i， 户 ， 以 便 保存 INSERT(i，j) 中 指定 的 计算 。 

对 每 一 个 块 ，DELETE 集 合 指定 LCM 应 该 从 这 一 块 中 删除 的 那些 计算 。 


DELETE(i). = UEEXPR(i) N LATERIN(i), i no 
当然 ， DELETE(nmo) 是 空 的 ， 因 为 没有 块 在 它 之 前 。 如 果 eEDELETE(D ,那么 在 所 有 揪 和 完成 之 后 ， 
e 在 i 中 的 第 一 次 计算 是 宛 余 的 。 在 i 中 有 向 上 暴露 使 用 的 e 的 任意 评估 序列 也 可 以 被 消除 ， 即 当 e 的 操作 数 
在 ;的 开始 和 这 一 评估 间 不 被 定义 时 , e 的 任意 评估 序列 也 可 以 被 消除 。 因为 e 的 所 有 评估 定义 相同 的 名 字 ， 
所 以 编译 器 无 需 重 写 对 已 删除 评估 的 后 期 引用 。 这 些 引 用 将 直接 引用 那些 LCM 已 证 明 产生 相同 值 的 e 的 
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更 早 评估 。 
对 于 我 们 的 例子 ，INSERT 和 DELETE 集 合 很 简单 。 
<B,, B> <B,, B> <B,, B,> <B,, Bs> 
INSERT {rzo, Tart 0 人 0 
B; B, B, 
DELETE 人 {rzo, ra? 0 


INSERT 和 DELETE 集 合 重 写 代 码 的 解释 如 图 10-9 所 示 。LCM 从 B: 删 除 定义 rx、r2a 的 表达 式 ， 并 把 
这 些 表 达 式 插入 从 B 到 B,; 的 边 上 。 


Bı: loadI 1 
loadAI ro,@m 
cmp_LT ri,r> 
cbr r3 

: mult 人 17 "18 
add Tig, S20 
jump 

: i2i T2 
addi ri,l 
i2i Ta 
cmp-GT 11,12 
cbr rs 


变换 代码 





图 10-9 情 性 代码 移动 后 的 例子 


因为 B; 有 两 个 后 继而 8B: 有 两 个 前 驱 ， 所 以 人 B:，B:> 是 一 个 临界 边 。 因 此 ，LCM 必 须 分 离 这 个 边 ， 创 
建 一 个 新 块 B: 来 保存 插入 的 ra 的 计算 。 分 离 边 <B;，Bz> 给 代码 增加 一 个 额外 的 Jump 。 后 继 的 代码 生成 几 
乎 肯定 地 把 B:, 中 的 jump 实 现 为 一 个 落下 ， 从 而 消除 与 此 相关 的 任何 代价 。 

注意 ，LCM 把 8: 中 定义 的 rs 的 拷贝 保留 下 来 。LCM 移 动 表达 式 ， 而 不 是 赋值 。( 回想 一 下 ，rs 是 一 
个 变量 ， 而 不 是 一 个 表达 式 。) 如 果 这 一 拷贝 是 不 必要 的 ， 那 么 寄存 器 分 配器 将 发 现 这 一 事实 并 将 其 合 
并 到 其 他 操作 中 。 | 

2. 提升 

编译 器 也 可 以 使 用 代码 移动 来 缩小 编译 代码 的 大 小 。9.2.4 节 引入 了 忙碌 表达 式 的 概念 。 编 译 器 可 以 
使 用 VERYBUSY 和 集合 的 计算 结果 来 执行 代码 提升 (code hoisting). 

这 一 想法 很 简单 。 对 于 某 个 块 5»， 一 个 表达 式 eEVERYBUSY(b) ， 当 且 仅 当 离 开 5b 的 每 一 条 路 径 都 评 
估 e， 而 且 5b 的 尾部 的 e 的 评估 与 沿 着 每 一 条 离开 b 的 路 径 上 的 e 的 下 一 个 评估 产生 相同 的 值 。( 也 就 是 说 ， 
e 的 任意 操作 数 都 不 在 bp 的 尾部 与 沿 着 离开 b 的 每 一 条 路 径 的 下 一 次 评估 之 间 被 重新 定义 。) 为 了 缩小 代码 ， 
编译 器 可 以 在 bp 的 尾部 插入 e 的 评估 ， 并 使 用 一 个 引用 来 取代 在 离开 b 每 一 条 路 径 上 的 e 的 第 一 次 出 现 。 

为 了 直接 替换 这 些 表 达 式 ， 编 译 器 将 需要 定位 这 些 表达 式 。 它 可 以 插入 e， 然 后 求解 另 一 个 数据 流 
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问题 ， 证 明 从 2 到 e 的 某 一 个 评估 的 路 径 是 e-clear 的 。 另 外 ， 它 也 可 以 遍历 离开 bp 的 每 一 条 路 径 来 寻找 e 被 
定义 的 第 一 个 块 ， 这 可 以 通过 在 这 个 块 的 UEEXPR 集 合 中 的 查找 来 实现 。 这 些 方法 似乎 都 比较 复杂 。 

一 个 更 简单 的 方法 是 让 编译 器 访问 每 一 个 块 5， 并 对 于 每 一 个 表达 式 eEVERYBUSY(b) 在 b 的 尾部 插 
入 e 的 一 个 评估 。 如 果 编 译 器 使 用 一 致 的 命名 规则 ， 就 如 在 LCM 讨 论 中 所 提 到 的 那样 ， 那 么 每 一 个 评估 
将 定义 一 个 适当 的 名 字 。 随 后 的 LCM 的 运用 或 元 余 消 除 将 消除 这 一 新 的 元 余 表 达 式 。 


10.3.3 特 化 


在 大 多 数 编 译 器 中 ，IR 程 序 的 形态 是 在 对 代码 的 任意 详细 分 析 之 前 由 前 端 决定 的 。 必 然 地 ， 这 将 产 
生 在 运行 程序 可 能 遇 到 的 所 有 上 下 文中 都 行 得 通 的 一 般 代码 。 然 而 ， 使 用 分 析 编 译 器 通常 能 够 充分 缩小 
代码 所 处 的 上 下 文 。 这 就 为 编译 器 利用 代码 执行 的 上 下 文 信息 来 特 化 操作 序列 创造 了 机 会 。 

作为 一 个 例子 ， 考 虑 常量 传播 。 常 量 传 播 试图 发 现 一 个 操作 的 参数 所 取 的 特殊 值 。 对 于 诸如 X<y x 
z 这 样 的 操作 ， 如 果 编 译 器 发 现 y 总 有 值 4， 且 z 是 非 负 的 ， 那 么 它 可 以 使 用 通常 代价 较 小 的 移 位 操作 取代 
这 个 乘法 。 如 果 它 还 发 现 z 有 值 17， 那 么 它 可 以 使 用 68 的 立即 装 和 人 取代 这 个 操作 。 这 些 操作 形成 一 个 层 
次 。 乘 法 是 普遍 的 ; 它 适 合 于 y 和 z 的 任意 值 (尽管 它 也 许 对 它们 的 某 些 值 会 产生 异常 ) 。 移 位 不 如 乘法 
普遍 : 它 产 生 正确 的 结果 ， 当 且 仅 当 y 有 值 4 且 z 是 非 负 的 。 当 然 ， 如 果 y 或 ?是 零 ， 那 么 X 也 是 零 。 装 和 人 立 
即 最 不 普遍 : 只 有 当 操作 数 具 有 y x z 的 值 是 已 知 的 这 样 的 性 质 时 它 才 有 效 。 

特 化 的 其 他 例子 包括 窜 孔 优化 (peephole optimization) #0143% Ja (tail-recursion elimination). 
罕 孔 优化 在 代码 上 滑动 一 个 小 “窗口 ”( 窥 孔 ) 并 在 这 个 窗口 内 寻找 简化 。 它 源 于 在 代码 生成 后 执行 某 
种 最 后 局 部 优化 的 一 个 有 效 方法 (参见 11.4.1 节 )。 

昆 递 归 消 除 识 唱 何 时 一 个 过 程 中 执行 的 最 终 操 作 是 一 个 自 递归 调用 。 尾 递归 消除 使 用 一 个 到 这 一 过 
程 的 第 一 个 指令 的 跳 转 取代 这 个 调用 ， 这 样 可 以 复 用 活动 记录 并 且 回 避 完 整 过 程 链接 约定 的 开销 。 在 使 
用 递归 遍历 数据 结构 或 执行 迭代 计算 的 程序 中 出 现 这 一 重要 的 情况 。 下 一 节 给 出 特 化 的 详细 例子 : 一 个 
基于 SSA 的 常量 传播 算法 。 

常量 传播 

使 用 SSA 形 式 ， 我 们 可 以 使 用 比 9.2.4 节 的 方程 直观 得 多 的 方法 重新 形式 化 常量 传播 。 称 之 为 实 疏 莘 
YEE (sparse simple constant propagation, SSCP) 的 这 一 算法 如 图 10-10 所 示 。 


TAX=X Vx 


i oh SSA aAg=a ife;=c¢ 
for each SSA name n - ; 
initialize Value(n) by rules cing=l ites # ey, 
specified in the text ATG AT 
if Value(n) # T then LAx=1L Vx 
Worklist — Worklist U {n} 
交 运 算 规则 


while (Worklist + 0) 
remove some n from Worklist 


Worklist — @ 


for each operation o that uses n T 
let m be the SSA name that o defines 
if Value(m) # L then . 
t + result of modelling m using meet rule 
if t # Value(m) then 
Value(m) + t 
Worklist — Worklist U {m} 


"Ci C Ck Cy Cmo 





图 10-10 ARRAK EIERE 
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SSCP 算 法 由 一 个 初始 化 阶段 和 一 个 传播 阶段 组 成 。 初 始 化 阶段 在 SSA 名 字 上 进行 迭代 。 对 于 每 个 
SSA 名 字 n， 初 始 化 阶段 根据 一 组 简单 的 规则 检查 定义 n 的 操作 并 设置 /a1ue(n)。 如 果 n 是 由 一 个 8 函数 
定义 的 ,那么 SSCP 设 置 Va1ue(m 为 T。 如 果 n 的 值 是 已 知 的 常量 c， 那 么 SSCP 设 置 Va1we(n) 为 c<。 如 
果 n 的 值 是 不 可 知 的 ， 例 如 ， 它 是 由 从 外 部 媒介 读 取 的 一 个 值 所 定义 的 ， 那 么 SSCP 设 置 Valueln) AL. 
最 后 ， 如 果 n 的 值 是 未 知 的 ， 那 么 SSCP 设 置 Yalve(n) AT. MRValue(n) 不 是 T， 算 法 把 n 加 到 工作 列 
表 中 。 

传播 阶段 是 直观 的 。 它 从 工作 列表 中 移 除 一 个 SSA 名 字 n。 算 法 检查 使 用 7 的 每 一 个 操作 0o0， 其 中 o 定 
义 某 个 SSA 名 字 m。 如 果 Valuelm) 已 经 达到 上 ， 那 么 不 再 需要 进一步 的 评估 。 和 否则 ， 传 播 阶段 通过 在 o 的 
操作 数 的 格 点 值 上 解释 这 一 操作 来 建 模 o 的 评估 。 如 果 模 型 化 的 结果 比 ya7ue(m 低 ， 那 么 它 相应 地 降低 
Value(m) 并 把 加 到 工作 列表 中 。 当 工作 列表 为 空 时 ， 这 一 算法 终止。 

在 格 点 值 上 解释 操作 需要 小 心 。 对 于 4% 国 数 ， 这 一 解释 的 结果 就 是 所 有 4 函数 的 参数 的 格 点 值 的 交 ， 
即使 一 个 或 多 个 参数 有 值 T 也 如 此 。 对 于 其 他 种 类 的 操作 ， 编 译 器 必须 运用 特定 操作 符 的 知识 。 如 果 任 
意 操作 数 有 格 点 值 T ， 那 么 评估 返回 T 。 如 果 所 有 操作 数 都 没有 格 点 值 T ， 那 么 这 一 模型 应 该 产生 适 
当 的 值 。 对 于 操作 xyx z， 且 Yalve(y) =3、Value(z)=17， 这 一 模型 应 该 产生 值 51。 如 果 Value(y) 
= 上 人， 这 一 模型 应 该 对 ya1ue(z)=0 产 生 0， 对 任意 其 他 格 点 值 产生 上 。SSCP 需 要 对 IR 中 的 每 一 个 求 值 
操作 做 类 似 的 解释 。 

(1) ERÈ SSCP 的 传播 阶段 是 一 个 典型 的 不 动 点 方案 。 可 以 通过 如 图 10-10 所 示 的 用 于 表示 值 的 


， 格 的 下 降 链 的 长 度 得 到 它 的 终止 性 和 复杂 度 。 与 任意 SSA 名 字 相关 的 Value 可 以 有 三 个 初始 值 : T. 


个 不 同 于 T 和 上 的 常量 ci 以 及 1 。 传 播 阶段 只 能 降低 它 的 值 。 对 于 给 定 的 SSA 名 字 ， 这 至 多 发 生 两 次 : 
从 工 到 c, 再 到 上 。 只 有 当 SSA 名 字 的 值 发 生变 化 时 ，SSCP 才 把 这 个 名 字 加 到 工作 列表 中 ， 所 以 每 一 个 
SSA 名 字 至 多 在 工作 列表 中 出 现 两 次 。 当 一 个 操作 的 操作 数 从 这 一 工作 列表 中 被 移 除 时 ，SSCP 评 估 这 一 
操作 。 因 此 ， 评 估 的 总 次 数 至 多 是 程序 中 使 用 的 次 数 的 两 倍 。 

(2) 覆盖 面 ”SSCP 发 现 9.2.4 节 中 的 数据 流 框架 发 现 的 所 有 常量 。 因 为 SSCP 把 未 知 值 初始 化 为 ， 
而 不 是 上 ， 所 以 它 可 以 把 某 些 值 传播 到 图 中 的 环 ， 即 CFG 中 的 循环 。 开 始 于 值 T 而 不 是 上 的 算法 通常 被 
称 为 乐观 (optimistic) 算法 。 这 一 术语 的 直观 印象 是 到 T 的 初始 化 允许 这 一 算法 把 信息 传播 到 环 区 域 ， 
乐观 地 假设 洛 着 后 边 的 值 将 认可 这 一 初始 传播 。 被 称 之 为 悲观 (pessimistic) 的 到 上 的 初始 化 不 允许 有 
这 种 可 能 性 。 

为 了 明白 这 一 点 ， 考 虑 图 10-11 中 的 SSA 片 段 。 如 果 这 一 算法 悲观 地 将 x: 和 xz 初始 化 为 上 ， 那 么 它 将 
不 会 把 值 17 传 播 到 循环 。 当 它 评估 Xx, 的 g 函 数 时 ， 它 计算 17 人 上 得 到 上 。 使 用 设置 到 上 的 x:，x: 也 被 设置 “ 
Bll, Hi AMON EAA. 


SSCP 格 值 


Xo e17 


| 


XP (xo,xz) 
Xz 《一 X1 十 Ty 





图 10-11 乐观 常量 传播 示例 


另 一 方面 ， 如 果 这 一 算法 乐观 地 把 未 知 值 初 始 化 为 T ， 那 么 它 可 以 把 xo 的 这 个 值 传播 到 循环 中 。 妆 
它 计算 x; 的 值 时 ， 它 评估 17 和 人 本 ， 并 把 结果 17 赋 给 x,。 因 为 x 的 值 已 发 生变 化 ， 所 以 算法 把 x 放置 到 工 
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作 列表 中 。 然 后 ， 这 一 算法 重新 评估 xz: 的 定义 。 例 如 ， 如 果 iiz 有 值 0， 那 么 算法 给 xz 赋值 17 并 把 x: 加 到 工 
作 列 表 中 。 当 它 重新 评估 4$ 函 数 时 ， 它 计算 17 和 17， 并 证 明 x1 是 17。 

考虑 当 ijz 有 值 2 时 将 发 生 什 么 。 这 时 ， 当 SSCP 评 佑 xi+ilz 时 ， 它 给 xz 赋值 19。 现 在 ，xi 得 到 值 17 人 19， 
即 上 。 这 传播 回 到 x:， 产 生 与 悲观 算法 相同 的 最 终结 果 。 


10.3.4 激活 其 他 转换 


通常 ， 一 个 优化 器 包括 主要 目的 是 为 其 他 转换 创建 或 揭示 机 会 的 遍 。 在 某 些 情况 下 ， 一 个 转换 改变 
代码 的 形态 使 它 更 易于 优化 。 而 在 另 一 些 情况 下 ， 这 个 转换 在 代码 中 创建 使 其 他 转换 安全 的 特定 条 件 成 
立 的 地 点 。 通 过 直接 创建 必要 的 代码 形态 ， 这 些 激活 转换 降低 优化 器 对 输入 代码 形态 的 敏感 性 。 

本 书 的 其 他 章节 描述 了 若干 激活 转换 。 块 复制 (8.7.1 节 ) 复制 各 个 块 来 消除 分 支 并 创建 一 种 状态 ， 
在 这 种 状态 下 ， 编 译 器 可 以 得 到 一 个 块 从 它 的 CFG 前 驱 继 承 而 来 的 上 下 文 的 更 精确 信息 。 例 如 ，12.4.2 
节 描 述 块 复制 是 如 何 改进 指令 调度 的 结果 的 。 内 联 替 换 (8.7.2 节 ) 合并 两 个 过 程 来 消除 过 程 调用 的 负荷 ， 
并 为 特 化 创建 更 大 的 上 下 文 。 本 节 给 出 三 个 简单 的 激活 转换 : MARI (loop unrolling). MRK WR 
(loop unswitching) MERE (renaming). 


1. 循环 展开 

循环 展开 是 最 古老 的 激活 转换 之 一 。 为 了 展开 一 个 循环 ， 编 译 器 复制 循环 体 ， 并 调整 控制 被 执行 迭 
代 的 数目 的 逻辑 。 考 虑 如 图 10-12a 所 示 的 简单 的 循环 。 

如 果 编 译 器 使 用 这 一 循环 体 的 四 个 拷贝 取代 这 个 循环 体 ， 以 4 的 因子 展开 循环 ， 那 么 它 就 可 以 使 用 
四 分 之 一 的 比较 和 分 支 执行 相同 效应 的 工作 。 如 果 编 译 器 知道 n 的 值 ， 比 如 说 100， 而 且 以 整除 n 的 因子 
展开 循环 ， 那 么 展开 的 循环 有 如 图 10-12b 所 示 的 简单 形式 。 | 


do i = 1 ton by 1 do i = 1 to 100 by 4 

a(i) = a(i) + b(i) a(i) = a(i) + b(i) 

end a(i+1) = a(i+1) + b(i+1) 
a(i+2) = a(i+2) + bf(i+2) 
a(it+3) = a(i+3) + b(i+3) 
end 





a) 源 循环 


i=l 
do while (i+3 < n) 
a(i) = a(i) + bi) 


a({itl) = a(i+1) + bfi+1l) 
a(i+2) = a(i+2) + b(i+2) 
a(i+3) = a(i+3) + b(i+3) 
i=i+4 
end 

do while (i < n) 
a(i) = a(i) + b(i) 
i=i+1 
end 


c) 由 4 展开 循环 ， 任 意 n 


b) 由 4 展开 循环 ，n=100 


i=1 

if (mod(n,2) > 0) then 
a(i) = a(i) + b(i) 
i=si+1] 

if (mod(n,4) > 1) then 
a(i) = a(i) + b(i) 
afi+l) = a(i+1) + b(i+1) 
i=i+2 

do j = i to n by 4 
a(j) * a(j) + b(j) 
a(j+1) = a(j+l) + b(j+1) 

: a(j+2) = a(j+2) + b(j+2) 
a(j+3) = a(j+3) + b(j+3) 
end 


中 由 4 展开 循环 ， 任 意 n 





图 10-12 展开 一 个 简单 循环 
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当 循 环 边界 未 知 时 ， 展 开 需 要 基 种 额外 的 逻辑 来 支持 满足 modn，4) =#*0 的 n 的 值 。 图 10-12c 中 的 循 
环 版 本 给 出 处 理 这 些 情况 的 简单 方法 。 图 10-12d 的 循环 版 本 使 用 稍微 多 一 些 的 代码 达到 相同 的 结果 。 以 
较 复 杂 的 循环 体 为 代价 ， 图 10-12d4 的 循环 版 本 允许 对 处 理 中 间 情 况 的 两 个 迭代 做 某 些 改进 。 

如 8.2.1 节 所 示 ，LINPACK 库 中 dmxpy 的 摘要 使 用 图 10-12d 的 方案 。 完 整 代 码 包 含 一 次 、 两 次 、 四 次 、 
八 次 和 十 六 次 迭代 的 情况 。 在 每 一 种 情况 中 ， 展 开 后 的 循环 包含 另 一 个 循环 ， 所 以 内 循环 的 工作 量 证 明 
大 范围 的 外 循环 展开 是 适宜 的 。 

循环 展开 减 小 程序 所 执行 的 总 操作 数 。 它 也 增加 程序 的 大 小 。( 如 果 循 环 体 对 指令 缓冲 而 言 变 得 太 
大 时 ， 那 么 结果 的 缓冲 失误 可 能 超出 降低 的 循环 负荷 所 带 来 的 任何 效益 。 ) 然而 ， 循 环 展开 的 主要 理由 
是 为 其 他 优化 创建 更 好 的 代码 形态 。 

展开 拥有 两 个 为 其 他 转换 创建 机 会 的 关键 性 效应 。 它 增加 循环 体内 的 操作 数量 。 相 对 于 短 循环 和 长 
分 支 等 待 时 间 ， 这 可 以 产生 更 好 的 调度 。 特 别 是 它 可 以 给 调度 器 带 来 更 多 可 以 同时 执行 的 独立 操作 。 它 
也 可 能 给 调度 器 带 来 足够 多 的 操作 来 填充 分 支 等 待 模 。 它 可 以 允许 调度 器 把 连续 内 存 存 取 移 到 一 起 。 这 
改进 局 部 性 并 为 一 次 可 以 处 理 更 多 数据 的 内 存 操作 的 使 用 提供 可 能 性 。 

作为 最 后 的 注释 ， 如 果 循 环 在 一 次 迭代 中 计算 在 后 面 选 代 中 使 用 的 值 ， 这 称 为 御 环 进位 数据 相关 
(loop-carried data dependence ) ， 而 且 如 果 需 要 拷贝 操作 为 后 期 使 用 保存 这 个 值 ， 那 么 循环 展开 可 以 消除 这 
些 拷贝 操作 。 对 于 拷贝 的 多 种 周期 ， 由 各 个 周期 长 度 的 最 小 公 倍 数 所 做 的 循环 展开 将 消除 所 有 的 拷贝 。 

2. 循环 反切 换 

循环 反切 换 把 作为 循环 不 变量 的 控制 流 操作 提升 到 循环 的 外 面 。 如 果 一 个 if-then-elise 结 构 中 的 请 
词 是 循环 不 变量 ， 那 么 编译 器 可 以 通过 把 if-then-~e1se 拉 到 循环 外 面 ， 并 在 新 的 if-then-e1se 的 每 个 
语句 体内 生成 这 个 循环 的 裁剪 拷贝 来 重 写 这 一 循环 。 图 10-13 给 出 一 个 短 循 环 的 这 种 转换 。 


if (x > y) then 
doi=lton do i=lton 
if (x > y) a(i) = b(i) * x 
then a(i) = b(i) * x` else 


else a(i) = b(i) * y do i = 1 ton 
a(i) = b(i) * y 


源 循环 ”反切 换 版 本 





图 10-13 反切 换 一 个 短 循环 


反切 换 是 一 种 激活 转换 ; 它 使 得 编译 器 以 其 他 方法 难以 实现 的 方式 裁剪 循环 体 。 反 切换 之 后 ， 剩 余 
的 循环 包含 更 少 的 控制 流 。 它 们 执行 更 少 的 分 支 和 其 他 支持 那些 分 支 的 操作 。 这 可 以 导致 更 好 的 调度 、 
更 好 的 寄存 器 分 配 和 更 快 的 执行 。 如 果 原 来 的 循环 包含 if-then-e1se 内 的 循环 不 变量 代码 ， 那 么 LCM 
将 不 能 把 它 移 到 这 一 循环 的 外 部 。 反 切换 之 后 ，LCM 很 容易 找到 并 消除 这 样 的 元 余 。 

反切 换 也 有 简单 直接 的 改进 程序 的 效应 ， 它 把 控制 循环 不 变量 条 件 的 分 支 罗 辑 移 到 循环 的 外 面 。 把 
控制 流 移出 循环 是 很 困难 的 。 基 于 数据 流 分 析 的 各 种 技术 ， 如 LCM ， 在 移动 这 样 的 结构 时 会 遇 到 问题 ， 


因为 这 一 转换 改变 分 析 所 依赖 的 CFG。 基 于 值 编 号 的 技术 可 以 识别 控制 if-then-e1se 结 构 的 谓词 是 相等 ”: 


的 某 些 情况 ， 但 是 这 些 技术 却 不 设法 从 循环 中 消除 这 一 结构 。 


日 译 者 的 理解 是 ， 如 果 第 一 种 拷贝 的 周期 为 4+， 即 每 4 次 选 代 需要 一 次 这 样 的 拷贝 ， 而 第 二 种 拷贝 的 周期 为 6， 
那么 以 12 为 因子 的 循环 展开 可 以 完全 消除 所 有 这 两 种 拷贝 。 一 一 译 者 注 
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3. 重 命名 

本 章 所 给 出 的 大 多 数 转换 都 涉及 对 程序 中 的 操作 进行 重 写 或 重 排序 的 工作 。 良 好 的 代码 形态 可 以 揭 
示 优 化 的 机 会 。 同 样 地 ， 良 好 的 名 字 和 集合 也 可 以 揭示 优化 的 机 会 。 

例如 ， 在 局 部 值 编 号 中 ,我 们 看 到 了 下 面 的 例子 : 

aecxty ao +— Xo + Yo 

bexty bo + Xo + Yo 

a+ 17 al «+ 17 

ce xty Co + Xo + Yo 


源 代码 SSA 形 式 


在 原来 的 代码 中 ， 局 部 值 编号 能 够 识别 出 x+y 的 所 有 三 个 计算 都 产生 相同 的 结果 。 然 而 ， 它 不 能 趟 换 x+y 
的 最 后 出 现 ， 因 为 中 间 对 a 的 赋值 破坏 了 它 识别 出 的 x+y 的 拷贝 。 

把 这 一 代码 转变 成 SSA 形 式 产生 如 图 右边 所 示 的 名 字 空 间 。 使 用 SSA 名 字 空 间 ，xotyo 在 最 终 的 操作 
时 仍然 可 用 ， 所 以 局 部 值 编号 可 以 使 用 一 个 对 ao 的 引用 替换 这 一 评估 。( 另 一 个 方法 是 修改 局 部 值 编号 
算法 使 得 它 认 可 b 为 x+y 的 另 一 个 拷贝 。 重 命名 是 更 简单 、 更 一 般 的 解决 方案 。 ) 

一 般 地 ， 名 字 的 精心 使 用 可 以 揭示 出 更 多 优化 机 会 ， 它 使 更 多 的 事实 对 分 析 可 视 并 避免 伴随 存储 复 
用 的 副作用 。 对 于 基于 数据 流 的 优化 ， 如 LCM ,分 析 依 赖 于 词法 相等 元 余 操 作 必 须 有 相同 的 操作 ， 而 
且 它 们 的 操作 数 必 须 有 相同 的 名 字 。@ 把 诸如 得 自 于 值 编 号 的 某 种 值 相等 编码 到 名 字 空间 的 方案 可 以 向 
LCM 揭 示 出 更 多 的 元 余 并 让 它 消除 这 些 元 余 。 

在 指令 调度 中 ， 名 字 创 建 限制 调度 器 重组 操作 的 能 力 的 相关 性 。 如 果 一 个 名 字 的 复 用 反映 了 值 的 真 
实 旋 向 ， 那 么 这 些 相关 性 是 正确 性 的 重要 组 成 部 分 。 如 果 一 个 名 字 的 复 用 出 现 的 原因 是 寄存 器 分 配器 出 
于 高 效 性 而 把 两 个 不 同 的 值 放 置 在 相同 的 寄存 器 内 ， 那么 这 些 相关 性 可 能 不 必要 地 限制 调度 ， 从 而 在 某 
些 情况 下 ， 导 致 低 效率 的 代码 。 

重 命名 是 一 个 微妙 的 问题 。SSA 构 造 法 根据 特定 的 规则 重 命名 程序 中 的 所 有 值 。 结 果 名 字 空 间 在 优 
化 中 是 有 帮助 的 。 这 些 命名 规则 已 在 情 性 代码 移动 及 其 补充 说 明 中 加 以 描述 。 命 名 的 影响 (参见 第 5 童 ) 
简化 很 多 转换 的 实现 ， 它 创建 值 的 使 用 名 字 与 计算 这 个 值 的 操作 的 文本 形式 之 间 的 一 一 映射 。 编 译 器 设 
计 者 长 和 久 以 来 已 认识 到 在 控制 流 图 中 移动 操作 (而且 ， 从 事实 上 改变 CFG 本 身 ) 可 能 是 有 益 的 。 同 样 ， 
他 们 也 应 该 认识 到 编译 器 无 需 受 程序 员 或 从 源 语 言 到 特定 I 节 的 转换 所 引入 的 名 字 空 间 的 制约 。 对 手头 的 
任务 做 适当 的 重 命名 可 以 改进 很 多 优化 的 有 效 性 。 


10.3.5 元 余 消除 


第 8 章 以 元 余 消 除 作为 揭示 优化 的 作用 域 的 原始 例子 。 它 描述 了 局 部 值 编号 、 超 局 部 值 编号 和 基于 
支配 者 的 值 编号 ， 所 有 这 些 都 是 基于 自 底 向 上 、 面 向 细节 并 使 用 散 列 法 来 识别 必须 相等 的 值 的 方法 。 它 
指出 使 用 可 用 表达 式 来 执行 全 局 公共 子 表达 式 消 除 可 以 作为 全 局 分 析 和 转换 的 一 种 方法 ， 并 指出 全 局 优 
化 一 般 需 要 把 分 析 与 转换 分 离开 来 。 

在 本 章 的 前 面部 分 ，LCM 是 作为 代码 移动 的 例子 出 现 的 。 它 把 以 可 用 表达 式 为 先导 的 数据 流 方 法 扩 


， 展 到 将 代码 移动 和 元 余 消 除 统一 起 来 的 框架 上 。 提 升 消除 相同 的 操作 以 减 小 代码 的 大 小 ; 但 不 减少 程序 


所 执行 的 操作 数量 。 


© LCM 不 使 用 SSA 名 字 ， 因 为 那些 名 字 使 文本 相等 含混 。 再 创建 文本 相等 带 来 额外 的 代价 ; 因此 ， 基 于 SSA 
的 LCM 比 10.3.2 节 中 所 示 的 LCM 版 本 运行 得 更 慢 。 
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10.4 高 级 话题 


本 章 选 取 的 大 多 数 例子 是 用 于 说 明 编 译 器 可 以 用 来 加 速 可 执行 代码 的 特殊 效应 的 。 有 时 候 ， 一 起 执 
行 两 种 优化 可 以 产生 分 别 使 用 这 两 个 优化 的 任意 组 合 都 不 可 能 得 到 的 结果 。 下 一 小 节 给 出 这 样 一 个 例子 : 
把 常量 传播 与 不 可 达 代码 消除 相 结合 。10.4.2 节 给 出 另 一 个 、 更 复杂 的 特 化 例子 : 使 用 线性 函数 测试 替 
换 的 操作 强度 减弱 。 我 们 所 给 出 的 05R 算 法 比 前 面 的 算法 简单 ， 因 为 这 一 算法 依赖 于 SSA 形 式 的 性 质 。 
10.4.3 节 简要 描述 编译 器 所 考虑 的 某 些 其 他 目标 功能 。 最 后 ，10.4.4 节 讨论 在 选择 优化 器 的 转换 集合 的 运 
用 顺序 中 所 产生 的 某 些 问题 。 


10.4.1 优化 组 合 


有 时 候 ， 同 时 形式 化 两 个 不 同 的 优化 并 对 它们 连带 求解 可 以 产生 由 分 别 运 行 各 优化 的 任意 组 合 都 得 
不 到 的 结果 。 作 为 一 个 例子 ， 考 虑 10.3.3 节 描述 的 稀 朴 简单 常量 传播 算法 。 它 为 程序 的 SSA 形 式 中 的 每 
一 个 操作 的 结果 指定 一 个 格 值 。 当 它 停 止 时 ， 它 使 用 格 值 T、 上 或 一 个 常量 对 每 一 个 定义 赋 标 签 。 一 
定义 有 值 T， 仅 当 它 依赖 于 未 初始 化 的 变量 ， 表 明 被 分 析 代码 中 的 一 个 逻辑 问题 。 

稀疏 简单 常量 传播 给 条 件 分 支 所 使 用 的 操作 数 指定 一 个 格 值 。 如 果 这 个 值 是 上 ， 那 么 两 个 分 支 目标 
都 是 可 达 的 。 如 果 这 个 值 即 不 是 下 也 不 是 上 ， 那 么 这 个 操作 数 必 须 有 一 个 已 知 值 ， 并 且 编译 器 可 以 使 用 
到 其 两 个 目标 中 的 一 个 的 跳 转 重 写 分 支 ， 从 而 简化 CFG。 因 为 这 从 CFG 中 消除 一 个 边 ， 所 以 它 可 能 消除 
进入 标签 为 被 消除 分 支 目标 的 块 中 的 最 后 的 边 ， 从 而 使 那个 块 不 可 达 。 原 理 上 ， 常 量 传播 可 以 忽视 不 可 
达 块 的 任意 效应 。 稀 朴 简 单 常量 传播 没有 利用 这 一 知识 的 机 制 。 


在 某 些 算法 中 ， 把 代码 的 SSA 形 式 看 成 是 一 个 图 可 以 简化 讨论 或 实现 。 强 度 减弱 算法 把 代码 的 | 
SSA 形 式 解释 成 一 个 图 。 | 
| “在 SSA 形 式 中 ,每 一 个 名 字 有 惟一 的 定义 ， 因 此 一 个 名 字 指 定 代 码 中 计算 这 个 名 字 的 值 的 特定 
操作。 一 个 名 字 的 每 个 使 用 出 现在 特定 的 操作 中 ， 所 以 这 一 使 用 可 以 解释 为 从 这 一 使 用 到 它 的 定义 
| 的 链 。 因 此 ， 把 名 字 映 射 到 定义 这 些 名 字 的 操作 上 的 简单 查找 表 ， 创 建 一 个 从 每 个 使 用 到 相应 定义 


的 链 。 从 定义 到 使 用 该 定义 的 操作 的 映射 要 稍微 复杂 一 些 。 然 而 ， 这 一 映射 可 以 在 SSA 构 造 法 的 重 | 
| 名 命 阶段 容易 地 构造 出 来 。 

在 画 SSA 图 时 ， 我 们 以 从 使 用 到 这 个 使 用 的 相应 定义 为 边 。 这 表明 SSA 名 字 所 蕴含 的 关系 。 编 | 
| 译 器 需要 沿 两 个 方向 这 历 这 些 边 。 强 度 减 弱 主要 从 使 用 向 着 定义 移动 。 稀 朴 条 件 常量 传播 算法 可 以 | 
| 认为 是 在 SSA 图 上 从 定义 向 着 使 用 移动 。 编 译 器 设计 者 能 够 容易 地 加 入 允许 在 两 个 方向 上 遍历 所 需 | 
的 数据 结构 。 | 
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4h A HAHEI (sparse conditional constant propagation, sccp) 算法 。 图 10-14b 勾 勒 出 SCCP 必 须 处 
理 的 各 种 操作 的 模型 化 规则 。 

为 了 避免 包含 不 可 达 操 作 的 效应 ，SCCP 处 理 初始 化 和 传播 的 方式 不 同 于 稀 朴 简单 常量 算法 。 第 一， 
SCCP 使 用 可 达 性 标签 标记 每 个 块 。 最 初 ， 设 置 每 个 块 的 标签 为 不 可 达 。 第 二 ，SCCP 必 须 初始 化 每 一 个 
SSA 名 字 的 格 值 为 T。 早 前 的 算法 在 初始 化 期 间 处 理 已 知 常量 值 的 赋值 (例如 ， 对 于 xX! 一 17， 它 可 以 初 
bette Value(x,) 为 17)。 而 SCCP 不 改变 格 值 ， 直 到 它 证 明 这 一 赋值 是 可 达 的 。 第 三 ， 这 一 算法 需要 两 个 
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工作 列表 来 进行 传播 : 一 个 是 CFG 中 的 块 的 工作 列表 ， 另 一 个 是 SSA 图 中 边 的 工作 列表 。 最 初 ， 这 一 
CFG 的 工作 列表 只 包含 人 口 结 点 m， 而 SSA 工 作 列表 是 空 的 。 和 迭代 传播 一 直 运 行 ， 直 到 它 耗 尽 这 两 个 工 
作 列 表 〈 这 是 一 个 典型 、 复 杂 的 不 动 点 计算 )。 


SSAWorkList «- 0 
CFGWorkList 一 {no} 
for each block b 
mark b as unreachable 
for each operation o in b 
Value(o) — T 


while (CFGWorkList # © or 
SSAWorkList # @) 
if CFGWorkList + 0 then 
remove some b from CFGWorkList 
mark b as reachable 
simultaneously model all the . 
¢-functions in b 
model, in order, each 
operation o in b 


if SSAWorkList # © then 


remove some s = (u,v) from SSAWorkList 


let o be the operation that uses v 
if Value(o) # 1 then 

t + result of modelling o 

if t # Value(o) then 


XC 
Value 一 < 


(对 常量 c) 


x & O(y,2): 
Value(x) + Value(y) ^ Value(z) 


xey op z: 
if Value(y) + L & Value(z) # L 
then Value(x) + interpretation 
of Value(y) op Value(z) 


cbr Ti hh: 
if r; = L or ry = TRUE 
and block 1, is marked as unreachable 
then add block 1, to CFGWorkList 
if rı = L or r = FALSE 
and block 12 is marked as unreachable 
then add block 12 to CFGWorkList 


jump > li: 
if block 1, is marked as unreachable 





Value(o) + t 
for each ssa edge e = (0x) 
if block(x) is reachable 
then add e to SSAWorkList 


a) 算法 


then add block 1, to CFGWorkList 


b) 模型 化 规则 





图 10-14 稀疏 条 件 常 量 传播 


为 了 处 理 CFG 工 作 列 表 中 的 块 b，SCCP 首 先 标记 块 为 可 达 。 下 一 步 ， 它 模型 化 b 中 所 有 % 国 数 的 效 
应 ， 在 重新 定义 所 有 4 函数 的 输出 的 格 值 之 前 ， 小 心 读 取 所 有 相关 参数 的 格 值 。( 回想 一 下 ， 一 个 块 中 的 
所 有 9 函数 是 同时 执行 的 。) 下 一 步 ，SCCP 以 线性 遍历 这 个 块 来 模型 化 b 中 每 一 个 操作 的 执行 。 图 10-14b 
给 出 一 组 典型 的 模型 化 规则 。 这 些 评估 可 能 改变 由 这 些 操作 定义 的 SSA 名 字 的 格 值 。 

SCCP 改 变 一 个 名 字 的 格 值 时 ， 它 必须 检查 SSA 图 中 连结 定义 已 改变 值 的 操作 与 后 继 使 用 的 边 。 对 
于 每 一 个 这 样 的 边 s=<u，v>， 如 果 包 含 v 的 块 是 可 达 的 ， 那 么 SCCP 把 这 个 边 s 加 到 SSA 工 作 列表 中 。 一 
且 SCCP 发 现 这 个 块 是 可 达 的 ， 那 么 在 一 个 不 可 达 块 中 的 使 用 就 会 被 评估 。 

中 的 最 后 的 操作 一 定 是 跳 转 或 分 支 。 如 果 这 个 操作 是 一 个 到 标记 为 不 可 达 的 块 的 跳 转 ， 那 么 SCCP 

就 把 这 个 块 加 到 CFG 工 作 列 表 中 。 如 果 这 是 一 个 分 支 ， 那 么 SCCP 就 检查 控制 条 件 表达 式 的 格 值 。 这 表 
明 一 个 或 两 个 分 支 目标 是 可 达 的 。 如 果 这 选择 了 还 没有 标记 为 可 达 的 目标 ， 那 么 SCCP 就 把 这 个 目标 加 
到 CFG 的 工作 列表 中 。 
”传播 步 难 之 后 ， 我 们 需要 一 个 最 后 遍 来 替换 操作 数 带 有 上 以 外 的 Va1ue 标 签 的 操作 。 它 能 够 特 化 很 
多 这 样 的 操作 。 它 还 应 该 使 用 适当 的 跳 转 操作 重 写 具有 已 知 结果 的 分 支 。( 这 将 导致 后 期 遍 消 除 它 的 代 
码 并 简化 控制 流 ， 如 10.3.1 节 所 述 。) 只 有 在 SCCP 知 道 每 一 个 定义 的 最 后 的 格 值 时 ， 它 才能 够 重 写 代 码 ， 
因为 常量 值 Ya1ue 标 签 在 后 面 可 能 变 成 1 。 . 


wn 
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1. 评估 和 重 写 操作 的 微妙 问题 

在 模型 化 个 别 操作 中 有 一 些微 妙 的 问题 。 例 如 ， 如 果 算 法 遇 到 操作 数 为 T 和 上 的 乘法 操作 ， 那 么 它 
可 能 推断 这 个 操作 产生 上 。 然 而 ， 这 样 做 是 不 成 熟 的 。 后 继 分 析 可 能 把 上 降低 到 零 ， 使 得 这 个 乘法 产生 
值 零 。 如 果 SCCP 使 用 规则 T x 上 一 上 ， 那 么 它 将 引入 非 单调 行为 的 可 能 性 : 乘法 值 可 能 遵从 序列 T、 
上 、0。 这 可 能 增加 算法 的 运行 时 间 ， 因 为 时 间 界 限 依赖 于 经 过 一 个 浅 格 的 单调 进程 。 同 样 重要 的 是 ， 
它 可 能 不 正确 地 引发 其 他 值 到 达 上 。 

为 了 解决 这 一 问题 ，SCCP 应 该 使 用 如 下 所 示 包 括 上 在 内 的 三 个 乘法 规则 : Tx 上 一 T， 对 于 a 
+ THat0, ax 上 一 上 以 及 0 x 上 一 0。 这 些 规则 也 适用 于 一 个 参数 值 可 以 完全 确定 结果 的 其 他 操作 。 
其 他 例子 包括 多 于 一 个 字 长 的 移 位 、 与 零 的 逻辑 与 以 及 与 所 有 位 为 1 的 逻辑 或 。 

某 些 重 写 具 有 无 法 预料 的 结果 。 例 如 ， 对 于 非 负 的 x， 使 用 一 个 移 位 取代 4 x x 将 把 一 个 可 交换 操作 
替换 成 一 个 不 可 交换 的 操作 。 如 果 编 译 器 随后 设法 使 用 交换 性 重组 表达 式 ， 那 么 这 早 前 的 重 写 将 使 编译 
器 丧失 一 个 机 会 。 这 种 相互 干涉 可 能 对 代码 的 质量 造成 明显 的 影响 。 为 了 选择 编译 器 把 4 x x 改 变 成 移 位 
的 时 机 ， 编 译 器 设计 者 必须 考虑 运用 优化 的 顺序 。 

2. 有 效 性 | 

SCCP 可 以 找到 稀疏 简单 常量 算法 无 法 找到 的 常量 。 同 样 地 ，SCCP 可 以 发 现 10.3.1 节 中 所 述 的 所 有 
算法 组 合 都 无 法 发 现 的 不 可 达 代 码 。 它 的 能 力 源 自 可 达 性 分 析 与 格 值 传播 的 结合 。 它 可 以 消除 某 些 CFG 
边 ， 因 为 格 值 足以 确定 一 个 分 支取 哪 一 条 路 径 。 它 可 以 忽视 不 可 达 操 作 (通过 初始 化 这 些 定义 为 T) 引 
发 的 SSA 边 ， 因 为 如 果 这 一 块 的 标记 变 为 可 达 ， 那 么 这 些 操 作 将 得 到 评估 。SCCP 的 威力 来 自 于 这 些 想 
法 间 的 相互 作用 ， 即 常量 传播 和 可 达 性 间 的 相互 作用 。 

如 果 可 达 性 在 确定 格 值 的 过 程 中 没有 起 到 作用 ， 那 么 通过 执行 常量 传播 (并 把 取 值 常量 的 分 支 重 写 
成 跳 转 ) ， 后 面 跟随 不 可 达 代码 消 除 ， 就 可 以 实现 相同 的 效应 。 如 果 常 量 传播 在 可 达 性 中 没有 起 到 作用 ， 
那么 通过 另外 一 种 硕 序 ， 即 不 可 达 代 码 消除 后 跟随 常量 传播 ， 可 以 得 到 相同 的 效应 。SCCP 寻 找 简化 的 
能 力 超过 了 这 些 结合 ， 原 因 正 是 由 于 这 两 个 优化 相互 依赖 。 


10.4.2 强度 减弱 


强度 减弱 是 这 样 的 转换 ， 它 使 用 计算 相同 结果 的 一 系列 低 成 本 (CW) 操作 取代 一 系列 重复 进行 的 
高 成 本 (“SR”) 操作 。 典 型 的 情况 是 把 基于 循环 索引 的 整数 乘法 替换 成 等 价 的 加 法 。 这 种 特殊 情况 经 常 
出 现 于 循环 中 的 数组 和 结构 地 址 的 展开 。 图 10-15 的 左 侧 给 出 为 下 面 的 简单 循环 生成 的 ILOC 代 码 : 


sum + 0 
for i + 1 to 100 
sum + sum + a(t) 

这 一 代码 是 半 剪 梳 SSA 形 式 ; 纯粹 是 局 部 的 值 (r ra rir) 即 没有 下 标 ， 也 没有 9 函数。 注意 ， 对 
a(i) 的 引用 是 如 何 展开 成 四 个 操作 ，subI、mu1tI、 计 算 (i-1) x 4+6@a 的 addI 和 定义 r, 的 1oad 的 。 

对 于 每 一 次 迭代 ， 这 一 操作 序列 重新 把 a(i) 的 地 址 计算 为 循环 索引 变量 i 的 函数 。 考 虑 ri、m、rz 和 
rs: 的 取 值 序列 。 

ru: {1,2,3,...;100} 

r: {0,1,2,...,99} 

rz: {0,4,8,...,396} 

r3: { @a, Ga+4, 8a+8,..., @a+396 } 


ri、rz 和 rs 中 的 值 只 是 为 了 计算 10ad 操 作 的 地 址 。 如 果 程 序 根据 前 一 个 值 计 算 r; 的 每 一 个 值 ， 那 么 
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它 可 以 消除 定义 r 和 r; 的 操作 。 当 然 ，r: 将 需要 一 次 初始 化 和 一 次 更 新 。 这 将 使 它 成 为 “个 非 局 部 名 字 ， 
所 以 它 也 将 在 1 和 1; 处 需要 一 个 8 函数 。 


loadl 0 > Tsp 
loadI 1 = Nig 


load! 
loadl 100 > rw. 0 > Ts 


loadI @a => rte 
addI Vtg +396 => Tin 
> phi Mtg sltg > re 


: phi Pigs > Ty 
phi rsosrsz => Ts 
sub] 51 => r 


phi rsosrsz => rs 


multI ri,4 => Ye 


load 
add! r2.,@a > ñ rt 


7 => % 


add Ts, y 

load r3 > r sra => Tsp 
addI rts4 => Mtg 
Cmp-LE rta riim => rs 


cbr T5 > 11,1, 


add Vs) 0%, => rsp 
addI ml > Mp 
cmp_LE Tiz» r100 => T5 
cbr 一 11,12 


强度 减弱 代码 





图 10-15 强度 减弱 示例 


图 10-15 的 右 侧 给 出 经 强度 减弱 、 线 性 函数 测试 替换 和 死 代 码 消除 后 的 代码 。 它 把 原本 在 r: 中 的 那些 
值 直接 计算 到 r., 中 ， 并 在 10ad 操 作 中 使 用 rt,。 在 原来 代码 中 使 用 r, 的 循环 尾部 测试 已 被 修改 成 使 用 rt。。 
这 使 得 r'、rz、r、rio、ra 和 m。 的 所 有 计算 都 成 为 死 计 算 。 这 些 计算 被 消去 来 产生 最 终 代码 。 现 在 ， 忽 
赂 9 函数 ， 这 一 循环 正好 包含 5 个 操作 ， 而 原来 的 代码 包含 8 个 操作 。 (在 从 SSA 形 式 翻译 回 可 执行 代码 时 ， 
9 函数 变 成 寄存 器 分 配器 通常 可 以 消除 的 拷贝 操作 。) 

如 果 mu1tI 操 作 比 addI 操 作 的 成 本 更 高 ， 那 么 上 述 的 成 本 节省 就 会 更 大 。 历 史上 看 ， 乘 法 的 高 代价 
已 经 证 明了 强度 减弱 的 正当 性 。 然 而 ， 即 使 乘法 和 加 法 有 相同 的 代价 ， 循 环 的 强度 减弱 形式 也 许 仍然 受 
欢迎 ， 因 为 它 为 后 来 的 转换 和 代码 生成 创建 更 好 的 代码 形态 。 特 别 地 ， 如 果 目 标 机 器 具有 自动 递增 寻 址 
模式 ， 那 么 循环 中 的 addI 操 作 可 以 又 入 内 存 操作 。 对 于 原来 的 乘法 ， 这 一 取舍 是 不 存在 的 。 

本 节 的 其 余部 分 给 出 强度 减弱 的 一 个 简单 算法 0S8， 其 后 给 出 线性 函数 测试 替换 的 一 个 方案 ， 此 方 
案 与 0SA 一 起 可 以 将 循环 尾部 测试 从 操作 于 mr, ;替换 成 使 用 re。05AR 操 作 于 代码 的 SSA 图 上 ; 图 10-16 给 出 
此 例 中 ILOC 的 SSA 形 式 与 SSA 图 之 间 的 关系 。 

(1) 背景 ”强度 减弱 寻找 如 下 上 下 文 ， 在 这 样 的 上 下 文中 ， 一 个 诸如 乘法 的 操作 在 循环 的 内 部 执行 ， 
且 这 个 操作 的 操作 数 是 @ 在 那个 循环 内 不 发 生变 化 的 一 个 值 ， 称 为 区 域 常 量 (region constant) ， 以 及 四 
随 着 选 代 系 统 地 发 生变 化 的 一 个 值 ， 称 为 归纳 变量 (induction variable )。 当 强度 减弱 发 现 这 一 情况 时 ， 
它 创建 一 个 新 的 归纳 变量 ， 它 以 更 高 效 的 方式 计算 与 原来 的 乘法 相同 的 值 序列 。 对 干 乘法 操作 的 操作 数 
形式 的 限定 保证 这 一 新 的 归纳 变量 可 以 使 用 加 法 而 不 是 乘法 来 计算 。 

我 们 称 能 够 以 这 种 方式 减弱 的 操作 为 候选 操作 (candidate operation). 为 了 简化 05R 的 表示 ， 我 们 只 
考虑 有 下 面 形式 之 一 的 候选 操作 : . . 


xecxi xeixc xeite xect+i 
其 中 ，c 是 一 个 区 域 常 量 ， 而 1 是 一 个 归纳 变量 。 寻找 和 减弱 候选 操作 的 关键 是 高 效 地 区 分 区 域 常量 与 归 
纳 变 量 。 一 个 操作 是 一 个 候选 ， 当 且 仅 当 它 有 上 述 形 式 之 一 ， 包 括 对 操作 数 的 限制 。 
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=> Tso 
> Tig 

= Pioo 

: phi riosriy > Ty 
phi rso srsz => Ts 
subI msl >r 
multi 1,4 >r 
addI r2,@a > r 
load r3 => ra 
add Tasrs => rs 


addI rii,l > Ny 


cmp_LE Fiza rio = 75 


cbr rs 一 lisle 





ILOC 中 的 SSA 形 式 相应 的 SSA 图 


图 10-16 ILOC 中 的 SSA 与 SA 图 的 关系 


530 区 域 常量 可 以 是 文字 常量 ， 例 如 10， 也 可 以 是 循环 不 变量 的 值 ， 即 一 个 在 循环 内 部 不 被 修改 的 值 。 
使 用 SSA 形 式 的 代码 ， 编 译 器 可 以 通过 检查 它 的 参数 的 惟一 定义 位 置 来 确定 它 是 否 是 循环 不 变量 ; CH 
定义 必须 支配 定义 这 一 归纳 变量 的 循环 入 口 。0SR 可 以 在 常量 时 间 内 检查 这 两 个 条 件 。 在 强度 减弱 之 前 
执行 惰性 代码 移动 和 常量 传播 可 以 揭示 出 更 多 可 以 作为 区 域 常量 的 值 。 

直观 地 ， 归 纳 变量 的 值 在 循环 内 形成 一 个 等 差 级 数 。 对 于 这 一 算法 的 目的 ， 我 们 可 以 使 用 更 特殊 、 
更 局 限 的 定义 :归纳 变量 是 满足 下 面条 件 的 SSA 图 中 的 强 连通 成 份 (SCC): 在 这 样 的 SCC 中 ， 更 新 这 一 
归纳 变量 的 值 的 每 一 个 操作 是 @ 一 个 归纳 变量 加 上 一 个 区 域 常量 ,或 者 四 一 个 归纳 变量 减 去 一 个 区 
域 常量 , RAO 一 个 函数 ,或 者 四 从 另 一 归纳 变量 的 寄存 器 到 寄存 器 拷贝 。 尽管 这 一 定义 不 如 常规 
定义 那么 一 般 ， 但 是 它 完 全 能 够 让 05R 算 法 寻找 并 减弱 候选 操作 。 为 了 确定 归纳 变量 ，05R 在 SSA 图 中 导 
找 SCC， 并 在 其 上 进行 迭代 以 确定 SCC 内 的 每 一 个 操作 是 否 是 这 四 个 类 型 中 的 一 个 。 

因为 05R 在 SSA 图 中 定义 归纳 变量 及 相对 于 CFG 中 的 一 个 循环 的 区 域 常量 ， 所 以 确定 一 个 值 是 否 是 
相对 于 这 一 包含 特定 归纳 变量 的 循环 的 常量 的 测试 是 复杂 的 。 考 虚 形 如 x 一 1 x c 的 操作 0， 其 中 1 是 一 个 
归纳 变量 。 为 使 成 为 强度 减弱 的 候选 者 ，c 必 须 是 相对 于 1 发 生变 化 的 最 外 循环 的 区 域 常量 。 为 了 测试 
是 否 有 这 一 性 质 ，0SR 必 须 将 SSA 图 中 的 1 的 SCC 重 新 与 CFG 中 的 一 个 循环 相关 联 。 

0sR 使 用 定义 1 的 SCC 中 的 最 低 逆向 后 序 编号 寻找 SSA 图 中 的 结 点 。 它 把 这 一 结 点 看 成 是 这 一 SCC 的 
头 部 ， 并 把 这 一 事实 记录 在 SCC 的 每 一 个 结 点 的 标题 字段 。(SSA 图 中 不 成 为 归纳 变量 的 一 部 分 的 任意 
结 点 设置 它 的 标题 字段 为 nu11。) 在 SSA 形 式 中 ， 这 一 归纳 变量 的 头 部 是 这 一 变量 发 生变 化 的 最 外 循环 
的 开始 处 的 $ 函 数 。 在 一 个 形 如 x 一 1 x c 的 操作 中 ， 其 中 i 是 二 个 归纳 变量 ， 如 果 包 含 c 的 定义 的 CFG 块 支 
配 着 包含 i 的 头 部 的 块 ， 那 么 c 是 一 个 区 域 常量 。 这 一 条 件 保证 c 在 1 发 生变 化 的 最 外 层 循环 内 是 一 个 不 变 
量 。 为 了 执行 这 一 测试 ，SSA 结 构 必须 产生 从 每 一 个 SSA 结 点 到 得 到 它 的 CFG 块 的 映射 。 

标题 字段 在 确定 一 个 操作 能 否 被 强度 减弱 的 过 程 中 起 着 重要 的 作用 。 当 0SR 遇 到 一 个 操作 x* yx z 时 ， 
它 可 以 通过 在 SSA 图 中 跟踪 到 y 的 定义 的 边 ， 并 检查 它 的 标题 字段 来 确定 y 是 否 是 一 个 归纳 变量 。mu11 标 

题字 段 表 明 y 不 是 一 个 归纳 变量 。 如 果 y 和 z 都 有 nu11 标 是 字段， 那么 操作 不 能 被 强度 减弱 。 
如 果 y 或 者 z 中 有 * -个 有 非 nu17 标 题字 段 ， 那 么 05R 使 用 那个 标题 字段 来 确定 另外 一 个 操作 数 是 否 是 
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一 个 区 域 常 量 。 假 设 y 的 标题 字段 不 是 nu1]。 为 了 寻找 y 发 生变 化 的 最 外 循环 的 人口 的 CFG 块 ，05R 以 y 的 

”标题 为 索引 查询 SSA 到 CFG 的 映射 。 如 果 包 含 z 的 定义 的 CFG 块 支配 y 的 头 部 块 ， 那 么 z 是 相对 于 归纳 变 
量 y 的 区 域 常量 。 | 

(2) 算法 ”为 了 执行 强度 减弱 ，05R 必 须 检 查 每 一 个 操作 并 确认 这 一 操作 的 一 个 操作 数 是 一 个 归纳 
变量 ,而 另 一 个 操作 数 是 一 个 区 域 常量 。 如 果 这 一 操作 满足 这 些 标准 ， 那 么 05R 可 以 通过 创建 计算 所 需 
值 的 一 个 新 的 归纳 变量 ， 并 使 用 这 个 新 归纳 变量 的 寄存 器 到 寄存 器 拷贝 替换 这 一 操作 来 减弱 这 一 操作 。 
( 05R 应 该 回避 创建 完全 相同 的 归纳 变量 .) 

基于 前 面 的 讨论 ， 我 们 知道 905R 可 以 通过 寻找 SSA 图 中 的 SCC 来 识别 出 归纳 变量 。OSR 还 可 以 通过 
检查 值 的 定义 来 发 现 区 域 常量 。 如 果 这 个 定义 得 自 于 一 个 立即 操作 ， 或 它 的 CFG 块 支配 归纳 变量 的 头 部 
的 CFG 块 ， 那 么 这 个 值 是 一 个 区 域 常量 。 关 键 是 如 何 把 这 些 想 法 结合 起 来 形成 一 个 高 效 的 算法 。 

05R 使 用 Tarjan 的 强 连通 区 域 探测 器 来 驱动 整个 过 程 。 如 图 10-17 所 示 ，05R 取 一 个 SSA 图 为 它 的 参数 ， 
并 对 它 反复 使 用 强 连 通 区 域 探 测 器 DFS5。( 当 DF5 已 访问 6 中 的 每 一 个 结 点 时 ， 这 一 过 程 停止 。) 


OSR(G) Process(N) 
nextNum + 0 if N has only one member n 
while there is an unvisited n € G then if n is a candidate operation 
DFS(n) then Replace(n,iv,rc) 


DFS(n) else n.Header — null 
n, D 
` PNum + nextNum++ alse ClassifylV(N) 


n.Visited +- true ClassifylV(N) 
n.Low + n.Num IsIV + true 
push(n) for each node n € N 
for each operand o of n ` if n is not a valid update for 
if 0. Visited = false then an induction variable 
DFS(o) then lslV + false 
n.Low + min(n.Lowo.Low) if IsIV then 
if o.Num < n.Num and header + n € N with the 
o is on the stack | lowest RPO number 
then n.Low + min(n.Lowo.Num) for each node n e N 
if n.Low = n.Num then n.Header + header 
SCC +O else 
until x =n do for each node n e N 
x + pop() if n is a candidate operation 
SCC + SCC U {x} then Replace(n,iv,rc) 
Process(SCC) _ else n.Header + null 





图 10-17 操作 符 强度 减弱 算法 


DFS 在 SSA 图 上 执行 深度 优先 搜索 。 对 应 于 访问 结 点 的 顺序 ， 它 给 每 一 个 结 点 指定 一 个 编号 。 它 把 
每 一 个 结 点 压 人 一 个 槛 ， 并 使 用 从 这 个 结 点 的 子 结 点 可 以 达到 的 一 个 结 点 上 的 最 低 深度 优先 编号 对 这 一 
结 点 赋 标 签 。 当 DFS 从 处 理子 结 点 的 工作 返回 时 ， 如 果 从 mn 可 达 的 最 低 结 点 具有 mn 的 编号 ， 那 么 0 是 一 个 
SCC 的 头 部 。DFS 从 栈 中 弹出 结 点 直到 它 达 到 n; 所 有 这 些 结 点 都 是 SCC 的 成 员 。 

DFS 以 简化 05R 其 余部 分 的 顺序 从 栈 中 消除 SCC。 当 一 个 SCC 被 从 栈 中 弹出 并 被 传送 到 Process 时 ， 
DFS 已 经 访问 了 它 在 SSA 图 中 的 所 有 子 结 点 。 如 果 我 们 把 SSA 图 的 边 解释 为 从 使 用 到 定义 ， 如 图 10-16 中 
的 SSA 图 所 示 ， 那 么 只 有 当 候 选 操作 的 操作 数 已 被 传送 到 Process 后 ， 算 法 才 会 遇 到 这 一 候选 操作 。 当 
Process 遇 到 一 个 强度 减弱 的 候选 操作 时 ， 它 的 操作 数 已 被 分 类 。 因 此 ，Process 可 以 在 深 度 优先 搜索 中 
检查 操作 、 识 别 出 候选 操作 ， 并 调用 RepTace 来 以 强度 减弱 的 形式 重 写 这 些 候选 操作 。 
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DFS 把 每 一 个 SCC 传 送 给 Process。 如 果 这 个 SCC 是 由 有 以 下 候选 形式 (xec xi, Ki xc、x<-i+-c 
或 Xe~c+i ) 的 一 个 结 点 rn 组 成 的 ， 那 么 Process 把 0 连带 它 的 归纳 变量 71v 和 它 的 区 域 常 量 rc， 传 送 给 
RepJace。Rep1ace 如 下 一 节 所 述 的 那样 重 写 这 一 代码 。 旨 如 果 这 个 SCC 包 含 多 个 结 点 ， 那 么 Process 把 这 
个 SCC 传 送 给 C1ass1fyTY 以 确定 它 是 否 是 一 个 归纳 变量 。 . 

对 于 SCC 中 的 每 一 个 结 点 ，C1assify1y 参 照 归纳 变量 的 有 效 更 新 集合 检查 这 个 结 点 。 如 果 所 有 更 新 
都 是 有 效 的 ， 那 么 SCC 是 一 个 归纳 变量 ,而 且 对 于 这 一 SCC 中 的 每 一 个 结 点 ，Process 把 它 的 标题 字段 
设置 成 包含 带 有 最 低 逆 向 后 序 编号 的 SCC 结 点 。 如 果 SCC 不 是 一 个 归纳 变量 ， 那 么 C1assifyIy 重 新 访问 
SCC 中 的 每 一 个 结 点 来 检测 它 是 否 是 一 个 候选 操作 ， 根 据 检测 结果 或 者 把 它 传送 到 Rep1ace， 或 者 设置 
它 的 头 部 以 显示 它 不 是 一 个 归纳 变量 。 

(3) BERG 05SA 的 剩余 部 分 实现 重 写 步 又 。Process 和 C1assTfyTl 都 调用 Rep1ace 来 执行 重 写 。 
图 10-18 给 出 Rep1Tace 的 代码 以 及 它 的 支持 阔 数 Reduce 和 App1y。 


Replace(n, iv, rc) Apply(op, 01, 02) 
result +- Reduce(n.op, iv, rc) result  Lookup(op, o1, 02) 
replace n with a copy from result if result is “not found” then 
n.header +- iv.header if 01 is an induction variable 
and 02 is a region constant 


Reduce(op,ivrc) then result +- Reduce(op, 01, 02) 


result + Lookup(op, iv, rc) 


if result is “not found” then else if 02 is an induction variable 
result +- NewName() . and o1 is a region constant 
Insert(op, iv, rcresult) then result + Reduce(op, 02, o1) 
newDef +- Clone(iv, result) else 


newDef header + iv.header result +- NewName() 
for each operand o of newDef Insert(op, o1, o2,result) 
if o.header = iv.header Find block b dominated by the 
then rewrite o with definitions of oj and 02 
Reduce(op, o, rc) i Create “op o1, 02 = result” 
else ifopisxor . : at the end of b and set its 
newDefopis@ ` header to null 
then replace o with return result 


Apply(op, o, rc) 


return result 





10-18 重 写 步 骤 的 算法 


Rep1ace 取 三 个 参数 ， 一 个 是 SSA 图 的 结 点 n， 一 个 是 归纳 变量 jy， 一 个 是 区 域 常量 rc。 后 两 个 参数 
是 1 的 操作 数 。AepJace 调 用 Reduce 来 重 写 n 表 示 的 操作 。 下 一 步 ，RepJace 使 用 它 所 产生 的 结果 的 拷贝 
操作 替换 n。 它 设置 n 的 标题 字段 并 返回 。 

Reduce 和 App1y 散 其 中 的 大 部 分 工作 。 它 们 使 用 一 个 散 列表 来 避 开 插入 重复 的 操作 。 因 为 05R 作 用 于 
SSA 名 字 ， 所 以 一 个 全 局 散 列表 就 足够 了 。 在 第 一 次 调用 DF5 之 前 ， 这 个 散 列表 在 05R 中 被 初始 化 。 
Insert 把 条 目 加 到 散 列表 中 ; Lookup 查 询 这 个 表 。 

Reduce 的 计划 很 简单 。 它 取 一 个 操作 码 和 两 个 操作 数 ， 它 或 者 创建 一 个 新 的 归纳 变量 以 替换 计算 ， 
或 者 返回 前 面 为 操作 码 和 操作 数 的 相同 组 合 所 创建 的 归纳 变量 的 名 字 。 它 查询 散 列表 以 避免 重复 工作 。 
如 果 希 望 的 归纳 变量 不 在 散 列 表 中 ， 那 么 它 用 一 个 两 步 过 程 创建 这 个 归纳 变量 。 首 先 ， 它 调用 CJone 来 
拷贝 1v 的 定义 ，iy 是 将 被 减弱 的 操作 的 归纳 变量 。 下 一 步 ， 它 在 这 一 新 定义 的 操作 数 上 重复 这 一 工作 。 


O 把 n 识 别 为 一 个 候选 的 过 程 必 然 要 把 它 的 一 个 操作 数 识 别 为 一 个 归纳 变量 1v， 并 把 另 一 个 操作 数 识别 为 一 个 
区 域 常量 。 





EH 309 


这 些 操作 数 属于 两 个 范畴 。 如 果 操 作 数 是 在 SCC 内 定义 的 ， 那 么 它 是 iv 的 一 部 分 ， 所 以 Reduce 在 这 
个 操作 数 上 递归 运行 。 这 通过 在 原来 的 归纳 变量 fy 的 SCC 的 局 围 复制 这 个 操作 数 的 行为 而 形成 这 个 新 的 
归纳 变量 。 定 义 在 SCC 外 部 的 操作 数 必 定 或 者 是 1 的 初始 值 或 者 是 递增 fy 的 值 。 而 初始 值 一 定 是 一 个 
SCC 外 部 的 4 函数 的 参数 ， 对 于 每 个 这 样 的 参数 ，Reduce 调 用 App JyY。 如 果 这 一 个 候选 操作 不 是 一 个 乘法 ， 
那么 Reduce 可 以 不 管 归 纳 变量 的 增 量 。 对 于 乘法 ，Reduce 必 须 计 算 新 的 增 量 为 旧 增 量 和 原来 的 区 域 常量 
rc 的 积 。 它 调用 4pp 1y 来 生成 这 一 计算 。 . 

App1y 取 一 个 操作 代码 和 两 个 操作 数 ， 定 位 代码 中 的 适当 点 并 插入 那个 操作 。 它 返回 那个 操作 的 结 
果 的 新 SSA 名 字 。 其 中 一 些 细 节 需 要 进一步 的 解释 。 如 果 这 一 新 操作 本 身 是 一 个 候选 操作 ， 那 么 4pp1y 
调用 Reduce 来 处 理 这 一 新 操作 。 否 则 ，App1y 得 到 一 个 新 名 字 ， 插 入 这 个 操作 ， 并 返回 结果 。( 如 果 ol 和 
02 都 是 常量 ，Ahpp7y 可 以 评估 这 个 操作 并 插入 一 个 立即 装 入 。) 它 使 用 支配 信息 为 这 一 新 操作 定位 一 个 适 
当 的 块 。 直 观 地 ， 这 一 新 操作 必须 进入 由 定义 这 一 操作 的 操作 数 的 各 块 所 支配 的 一 个 块 。 如 果 一 个 操作 
数 是 一 个 常量 ， 那 么 4ppJy 可 以 在 定义 另外 一 个 操作 数 的 块 中 复制 这 一 常量 。 否 则 ， 两 个 操作 数 都 必须 
有 支配 头 部 块 的 定义 ， 而 且 一 个 操作 数 必 须 支 配 另 一 个 操作 数 。AppJy 可 以 在 后 者 的 定义 之 后 立即 插入 
这 个 操作 。 . 

(4) 回 到 我 们 的 例子 ”考虑 当 05R 遇 到 图 10-16 中 的 例子 时 将 发 生 什么 情况 。 假 设 05R 开 始 于 一 个 标 
签 为 r, 的 结 点 ， 并 假设 它 在 访问 右 子 结 点 之 前 访问 左 子 结 点 。 它 沿 着 定义 rs、rs、rz、r 和 mi 的 操作 链 
向 下 递归 处 理 。 在 ri 处 ， 它 在 r1, 上 递归 处 理 ， 然 后 在 ri( 土 递归 处 理 。 它 找到 包含 文字 常量 1 的 两 个 单 结 
点 SCC。 二 者 都 不 是 候选 操作 ， 所 以 Process 通 过 设置 它们 的 标题 为 417 来 标识 它们 为 非 归 纳 变量 。 

DF3 发 现 的 第 一 个 非 平凡 SCC 包 含 rm 和 mi。 所 有 操作 都 是 一 个 归纳 变量 的 有 效 更 新 ， 所 以 C7assyFyTY 
标识 每 一 个 结 点 为 一 个 归纳 变量 ， 设 置 它 的 标题 字段 指向 在 SCC 中 带 有 最 低 深度 优先 编号 的 结 点 ， 即 
的 结 点 。 

现在 ，DF5 返 回 r1 的 结 点 。 它 的 左 子 结 点 是 一 个 归纳 变量 而 它 的 右 子 结 点 是 一 个 区 域 常量 ， 所 以 它 
调用 Reduce 来 创建 一 个 归纳 变量 。 在 这 种 情况 下 ， 六 是 rmi- 1， 所 以 新 创建 的 归纳 变量 有 一 个 比 原来 归 
纳 变量 的 初始 值 小 1 的 初始 值 0。 增 量 相 同 。 图 10-19 在 标签 “for r,” 的 下 方 给 出 Reduce 和 App1y 创 建 的 
SCC. 最 后 ， 使 用 一 个 拷贝 操作 rm 一 ro 替换 的 定义 。 这 一 拷贝 操作 被 标记 为 一 个 归纳 变量 。 





图 10-19 示例 的 转换 SSA 图 
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FF, DFSE RARE Or HUE SHLRAVSCC. Process RIX TSCCE— MEME, EEE 
操作 数 (现在 定义 ri 的 拷贝 ) 是 一 个 归纳 变量 ， 而 它 的 右 操作 数 是 一 个 区 域 常量 。Process 调 用 RepJace 
来 创建 一 个 值 为 ri x 4 的 归纳 变量 。Reduce 和 App1y 复 制 r! 的 这 个 归纳 变量 ， 并 调整 增 量 ， 因 为 这 个 操作 
是 一 个 乘法 并 把 一 个 拱 贝 加 到 rz。 

下 一 步 ，DF5 要 把 r ,的 结 点 传送 到 Process。 从 而 创建 另 一 个 以 8a 为 初始 值 的 归纳 变量 并 把 它 的 值 拷 
Wir; 

Proces shi load, 其 后 跟着 一 个 计算 和 的 SCC， 它 发 现 这 些 操作 都 不 是 候选 操作 。 

最 后 ，0SR 调 用 DFS 以 处 理 cbr 的 未 访问 结 点 。DFS 访 问 这 一 比较 ， 它 是 前 面 所 标记 的 归纳 变量 ， 以 及 
常量 100。 不 再 出 现 进一步 的 减弱 操作 。 

图 10-19 中 的 SSA 图 给 出 此 过 程 创建 的 所 有 归纳 变量 。 标 签 为 “for ri” 和 “for r,” 的 归纳 变量 是 死 
的 。i 的 归纳 变量 也 将 是 死 的 ， 只 有 循环 尾部 测试 仍然 使 用 它 。 为 了 消除 这 一 归纳 变量 ， 编 译 器 可 以 运 
用 线性 函数 测试 替换 来 把 这 一 测试 转换 成 r; 的 归纳 变量 。 

线性 函数 测试 蔡 换 

强度 减弱 通常 消除 归纳 变量 的 所 有 使 用 ， 只 有 循环 尾部 测试 的 使 用 例外 。 对 于 循环 尾部 测试 ， 编 译 
器 也 许 能 够 重 写 循环 尾部 测试 使 其 使 用 循环 中 的 另外 一 个 归纳 变量 。 如 果 编 译 器 能 够 消除 这 最 后 的 使 用 ， 
那么 它 就 可 以 消除 作为 死 代 码 的 原来 的 归纳 变量 。 这 一 转换 被 称 为 线性 函数 测试 替换 (LFTR )。 

为 了 执行 LETR ， 编 译 器 必须 (1) 定位 依赖 于 其 他 不 需要 的 妇 纳 变量 的 比较 ，(2) 定位 这 一 比较 能 
够 使 用 的 一 个 适当 的 新 归纳 变量 ， (3) 为 这 个 被 重 写 的 测试 计算 正确 的 区 域 常量 ， 以 及 (4) 重 写 代 码 。 
使 LFTR 与 0SR 合 作 可 以 简化 产生 快速 、 高 效 转换 的 所 有 任务 。 

LFTR 的 目标 操作 是 参照 一 个 区 域 常量 比较 一 个 归纳 变量 的 值 。0SR 检 查 程序 中 的 每 一 个 操作 以 确定 


.这 个 操作 是 否 是 强度 减弱 的 候选 。 它 可 以 轻而易举 地 构建 包含 归纳 变量 的 所 有 比较 操作 的 列表 。03A 完 


成 它 的 工作 之 后 ，LEFTR 应 该 重 访 每 一 个 比较 。 如 果 一 个 比较 的 归纳 变量 参数 被 05AR 进 行 强度 减弱 ， 那 么 ， 
LFTR 应 该 重新 定向 这 一 比较 来 使 用 这 一 新 的 归纳 变量 。 

为 了 使 这 一 过 程 得 以 实现 ，Reduce 可 以 记录 用 于 得 到 它 所 创建 的 新 归纳 变量 的 数学 关系 。 它 可 以 插 
入 从 原来 的 归纳 变量 中 的 每 一 个 结 点 到 它 的 减弱 副本 的 相应 结 点 的 特殊 LFTR 边 ， 且 使 用 负责 创建 新 归 
纳 变量 的 候选 操作 的 操作 码 和 区 域 常量 对 这 个 边 赋 标签 。 图 10-20 给 出 加 到 本 例子 的 SSA 图 上 的 这 些 边 。 
例子 包含 一 系列 减弱 这 些 减 能 创建 带 有 适当 标签 的 边 的 链 。 从 原来 的 归纳 变量 开始 ， 我 们 可 以 找到 标 
@-1. <4ffit+ea. 








图 10-20 LFTR 后 的 示例 
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- 当 LFTR 找 到 应 该 被 替换 的 比较 时 ， 它 可 以 从 它 的 归纳 变量 参数 开始 跟踪 边 链 ， 直 到 得 自 于 一 个 或 
多 个 减弱 的 链 的 最 后 归纳 变量 。 这 一 比较 应 该 在 这 一 归纳 变量 和 适当 的 新 区 域 常量 间 进 行 
LFTR 所 遍历 的 边 上 的 标签 描述 为 了 得 到 新 的 区 域 常量 而 施加 于 原 区 域 常量 之 上 的 转换 ,在 本 例子 中 ， 
边 的 痕迹 从 r1, 到 r,。， 并 为 被 转换 测试 产生 值 (100 - 1) x 4+@a。 图 10-20 给 出 这 些 边 和 被 重 写 的 测试 。 
LFTR 的 这 一 版 本 简单 高 效 。 它 依赖 于 与 05R 的 密切 合作 来 识别 可 能 被 重 定向 的 比较 并 留 下 它 所 执行 
的 减弱 记录 。 使 用 这 两 个 数据 结构 ，LFTR 能 够 找到 重 定向 的 比较 ， 找 到 重 定向 它们 的 适当 位 置 ， 找 到 
比较 的 常量 参数 的 必要 转换 。 


10.4.3 优化 的 其 他 目标 


1. 生成 更 小 的 代码 

在 某 些 应 用 中 ， 编 译 代 码 的 尺寸 很 重要 。 如 果 一 个 应 用 软件 在 其 执行 之 前 在 相对 缓慢 的 通信 链 之 间 
传输 ， 那 么 我 们 感觉 到 的 运行 时 间 是 下 载 时 间 与 运行 时 间 之 和 。 这 使 代码 尺寸 成 为 主要 的 考虑 因素 ， 因 
为 在 这 一 代码 传输 的 时 候 用 户 需 要 等 待 。 同 样 地 ， 在 很 多 嵌入 式 应 用 软件 中 ， 代 码 存储 于 一 个 永久 、 只 
读 的 内 存 (ROM) 中 。 因 为 更 大 的 ROM 要 花费 更 多 的 金钱 ， 所 以 代码 尺寸 变 成 一 个 经 济 问题 。 

编译 器 设计 者 可 以 通过 利用 直接 缩小 代码 的 转换 来 解决 这 一 问题 。 

。 提 升 (hoisting) (如 9.2.4 节 所 述 ) 通过 使 用 单一 等 价 操作 替换 多 个 相同 操作 来 缩小 代码 。 只 要 表 

达 式 在 插入 点 是 忙碌 的 ， 那 么 提升 就 不 加 长 任意 执行 路 径 。 

* 下 沉 (sinking) 在 CFG 中 把 若干 公共 的 代码 序列 向 前 移动 到 只 需 这 一 序列 的 一 个 拷贝 即 可 的 地 点 。 

在 下 沉 的 一 种 特定 形式 ， 交 又 跳 转 (cross jumping) 中 ， 编 译 器 检查 所 有 以 相同 标签 为 目标 的 跳 

转 。 如 果 在 到 这 一 标签 的 跳 转 之 前 是 相同 的 操作 ， 那 么 编译 器 可 以 把 这 一 操作 移动 到 这 一 标签 并 

只 保留 这 一 操作 的 一 个 拷贝 。 这 在 不 加 长 执行 路 径 的 前 提 下 消除 重复 的 操作 。 

。 过 程 抽象 (procedure abstraction) 使 用 模式 匹配 技术 来 寻找 重复 的 代码 序列 并 使 用 对 一 个 公共 实 

现 的 调用 替换 这 些 重复 代码 。 如 果 这 一 公共 代码 序列 比 这 一 调用 所 需要 的 代码 序列 长 ， 那 么 上 述 

币 法 可 以 节省 空间 。 它 使 代码 变 慢 ， 因 为 每 一 个 抽象 的 代码 序列 被 对 这 一 抽象 过 程 的 调用 以 及 一 

个 跳 转 返回 所 取代 。 过 程 抽 象 可 以 运用 于 整个 程序 来 寻找 不 同 过 程 的 公共 序列 。 

作为 另外 一 个 方法 ， 编 译 器 可 以 避 开 加 大 代码 的 转换 。 例 如 ， 循 环 展 开 一 般 要 加 大 代码 。 同 样 地 ， 
LCM 可 能 由 于 插入 新 操作 而 加 大 代码 。 通 过 精心 选择 算法 并 避 开 引起 代码 增 大 的 那些 算法 ， 编 译 器 设计 
者 可 以 构建 总 是 生成 简洁 代码 的 编译 器 。 

2. 避免 页 错误 和 指令 缓冲 失误 

在 某 些 环境 中 ， 页 错误 和 指令 缓冲 失误 所 带 来 负荷 使 得 我 们 值得 以 改进 代码 内 存 局 部 化 的 方式 转换 
代码 。 编 译 跨 可 以 使 用 若干 不 同 但 又 相关 的 效应 来 改进 指令 流 的 分 页 和 缓冲 行为 。 

。 过 程 放置 (procedure placement): 如 果 4 反 复 调 用 B， 那 么 编译 器 应 该 保证 4 和 8 在 内 存 中 占据 相 邻 

的 位 置 。 如 果 它 们 适合 同一 页 面 ， 那 么 这 可 以 减少 程序 的 工作 设置 。 把 它们 放置 在 相 邻 位 置 还 可 

以 减少 指令 缓冲 内 冲突 的 可 能 性 。 

。 块 放置 (block placement): 如 果 块 b, 结 束 于 一 个 分 支 且 编 译 器 知道 这 个 分 支 常常 把 控制 转 到 5b,， 

那么 编译 器 就 可 以 把 b; 和 4b 放置 在 连续 的 内 存 中 。 这 使 得 bj 成 为 这 一 分 支 的 落下 情况 (而 且 大 多 数 

处 理 器 支持 并 欢迎 这 一 落下 情况 )。 它 还 增加 指令 缓冲 中 硬件 预 取 机 制 的 效率 。 

。 锚 误 清 除 (fluff removal): 如 果 编 译 器 能 够 确定 某 一 代码 片段 很 少 执行 ， 即 绝 大 部 分 时 间 它们 是 

分 支 不 采用 的 目标 ， 那 么 编译 器 可 以 把 它们 移 到 较 远 的 位 置 。 这 种 很 少 执行 的 代码 无 需 放 在 缓冲 

器 中 并 降低 带 入 处 理 器 中 的 有 用 操作 的 密度 。( 值 得 把 例外 处 理 的 代码 都 保留 在 同一 页 上 ， 但 应 该 
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把 它们 放置 不 在 同一 道上 .) 

为 了 高 效 地 实现 这 些 转换 ， 编 译 器 需要 了 解 代码 中 每 一 条 路 径 的 采用 频率 的 精确 信息 。 收 集 这 些 信 
息 一 般 需 要 更 复杂 的 编译 系统 ， 这 样 的 编译 系统 收集 执行 简 档 数据 并 把 这 一 数据 反 过 来 与 代码 相关 联 。 
用 户 编译 一 个 应 用 软件 并 在 “具有 代表 性 的 ”输入 上 执行 这 一 应 用 软件 。 在 此 之 后 ， 编 译 器 使 用 来 自 于 
这 些 运行 的 简 档 数据 在 第 二 次 编译 中 优化 代码 。 与 编译 同样 古老 的 另 一 个 方法 是 构建 CFG 模 型 并 使 用 合 
理 转 换 可 能 性 来 估 测 执行 频率 。 


10.4.4 优化 序列 的 选择 


一 组 特定 转换 的 选取 和 运用 这 些 转换 的 顺序 是 设计 优化 编译 器 的 一 项 关键 任务 。 对 于 任意 特定 问题 ， 
存在 许多 不 同 的 技术 。 每 一 个 技术 适用 于 不 同 的 情况 。 很 多 技术 描述 若干 问题 的 某 个 局 部 。 

为 了 使 上 述 描述 更 具体 ， 回 想 一 下 我 们 给 出 的 消除 元 余 的 方法 。 这 些 方法 包括 三 个 值 编 号 技术 《局 
部 、 超 局 部 和 基于 支配 者 的 技术 ) 和 两 个 基于 数据 流 分 析 (基于 可 用 表达 式 的 全 局 公共 子 表达 式 和 情 性 
代码 移动 ) 的 技术 。 值 编号 技术 使 用 宛 余 的 基于 值 的 概念 来 寻找 并 消除 元 余 。 这 些 技术 的 区 别 在 于 优化 
的 作用 域 不 同 : BAR (BR) PROBA (AM) 以 及 整个 CFG 减 去 后 边 ( 基 于 支配 者 )。 
这 些 技 术 还 执行 常量 传播 并 使 用 算术 等 式 消除 某 些 无 用 操作 。 基 于 数据 流 的 技术 使 用 元 余 的 词法 概念 : 
只 有 当 两 个 操作 有 相同 的 名 字 时 它们 等 价 。 全 局 公共 子 表达 式 消 除 只 消除 元 余 ， 而 惰性 代码 移动 既 消 除 
元 余 又 消除 部 分 元 余 ， 并 执行 代码 移动 。 

在 设计 优化 编译 器 时 ， 编 译 器 设计 者 必须 决定 如 何 消除 元 余 。 在 上 述 这 5 种 方法 中 的 选择 涉及 决定 
哪些 情况 是 重要 的 、 实 现 的 相对 难度 以 及 较 之 运行 时 利益 相 比 ， 编 译 时 代价 如 何等 问题 。 使 情况 更 为 复 
杂 的 是 ， 存 在 更 多 技术 。 

同样 困难 的 是 ， 不 同 效应 的 优化 之 间 相 互 影响 。 一 些 优化 可 以 创建 另外 一 些 优化 的 机 会 IER 
量 传播 和 情 性 代码 移动 通过 把 更 多 的 值 作 为 区 域 常量 来 改进 强度 减弱 。 对 称 地 ， 一 些 优化 可 以 降低 另 
外 一 些 优化 的 效果 ， 如 元 余 消 除 可 能 通过 使 某 些 值 在 程序 中 的 生存 期 更 长 来 复杂 化 寄存 器 分 配 。 两 个 
优化 的 效应 也 可 能 会 交 迭 。 在 实现 稀疏 条 件 常 量 传播 的 编译 器 中 ， 值 编号 技术 的 常量 全 入 能 力 的 重要 
性 大 打折 扣 。 

在 选择 一 组 优化 之 后 ， 编 译 器 设计 者 必须 选择 运用 这 些 优化 的 顺序 。 对 这 一 顺序 的 某 些 约束 是 显 而 
易 见 的 ; 例如 ， 值 得 在 强度 减弱 之 前 运行 常量 传播 和 代码 移动 。 而 其 他 的 约束 却 不 是 显然 的 ; 例如 ， 循 
环 反切 换 是 否 应 该 先 于 强度 减弱 ? 常量 传播 是 否 应 该 把 x<-y x 4， 其 中 y > 0， 转 换 成 一 个 移 位 操作 ? 这 
一 决策 依赖 于 哪些 遍 先 于 常量 传播 ， 哪 些 遍 后 于 常量 传播 。 最 后 ， 某 些 优化 可 能 要 执行 多 次 。 强 度 减 弱 
之 后 ， 死 代码 消除 进行 清除 的 工作 。 在 强度 减弱 之 后 ， 编 译 器 可 能 再 一 次 运行 常量 传播 以 试图 把 所 有 剩 
余 的 乘法 转换 成 移 位 。 另 外 ， 在 判断 已 经 获得 了 所 有 的 全 局 效应 的 情况 下 ， 也 可 能 使 用 局 部 值 编号 达到 
与 上 相同 的 效应 。 

如 果 编 译 器 设计 者 希望 提供 不 同 层次 的 优化 ， 那 么 他 (她 ) 需要 设计 若干 编译 序列 ， 每 一 个 编译 都 
有 自己 的 根本 原因 和 自己 的 一 组 遍 。 更 高 层次 的 优化 一 般 要 增加 更 多 的 转换 。 它 们 还 可 能 重复 某 些 优化 
来 利用 早 前 的 优化 所 创建 的 机 会 。 对 于 执行 优化 的 顺序 ， 可 以 参见 Muchnick[262]。 


10.5 概括 和 展望 


优化 编译 器 的 设计 和 实现 是 一 项 复杂 的 工作 。 本 章 介绍 了 考虑 转换 的 概念 框架 ， 即 效应 的 分 类 。 这 
一 分 类 中 的 每 一 个 范畴 都 给 出 了 若干 例子 加 以 展示 ， 这 些 例 子 或 者 是 本 章 所 给 的 例子 ， 或 者 是 本 书 其 他 
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章节 的 例子 。 
编译 器 设计 者 所 面临 的 挑战 是 选择 一 组 能 够 良好 好 配合 来 生成 良好 代码 的 转换 : 代码 必须 满足 用 户 
的 需求 。 在 编译 器 中 实现 的 特定 转换 在 很 大 程度 上 决定 能 够 产生 良好 代码 的 程序 FRW. 


本 章 注释 


尽管 本 章 所 给 出 的 算法 是 现代 的 ,但 是 很 多 基本 思想 早 在 20 世 纪 60 年 代 和 20 世 纪 70 年 代 已 是 众 所 周 
知 。 死 代码 消除 ， 代 码 移动 、 强 度 减弱 和 元 余 消 除 都 已 由 Allen (于 1969 年 ) [12] 和 Cocke、Schwartz[86] 
描述 过 。20 世 纪 70 年 代 以 来 的 若 于 论文 概括 了 这 一 领域 的 状况 L15，28 ，308]。Morgan[260] 和 
Muchnick[262] 所 著 的 书籍 讨论 了 优化 编译 器 的 设计 、 结 构 和 实现 。Wolfe[335]、Allen 和 Kennedy[19] 集 
中 讨论 基于 相关 性 的 分 析 和 转换 。 | 

pead 以 标记 清除 风格 实现 了 由 Kennedy[203，206] 提 出 的 死 代码 消除 。 它 使 人 们 想起 Schorr-Waite 的 
标记 算法 [299]。 特 别 地 ，Dead 是 由 Cytron 等 [104， 参 见 7.1 节 ] 的 工作 编辑 而 成 的 。C1ean 是 由 Rob 
Shillner 于 1992 年 开发 并 实现 的 [245]。 

LCM 改 进 了 Morel 和 Renvoise 的 经 典 部 分 元 余 消 除 算法 [259]。 那 篇 原始 论文 激发 了 很 多 改进 方法 ， 
包括 [76，121，312，124]。Knoop、Riithing 和 Steffen 的 情 性 代码 移动 [215] 改 进 了 代码 放置 ; 10.3.2 节 给 
出 的 公式 使 用 了 Prechsler 和 Stadel[125] 提 出 的 方程 。Bodik、Gupta 和 Soffa 把 这 一 方法 与 复制 结合 在 一 起 
来 寻找 并 消除 所 有 元 余 代码 [41]。 

提升 作为 降低 代码 空间 的 一 种 技术 出 现 于 Allen-Cocke 目 录 中 。 使 用 忙碌 表达 式 的 公式 出 现在 若干 地 
方 ， 包 括 Fischer 和 LeBlanc[140]。 下 沉 或 交叉 跳 转 是 由 Wulf 等 描述 的 [339]。 


窥 孔 优化 和 尾 递 归 消 除开 始 于 20 世 纪 60 年 代 初 。 窥 孔 优化 最 初 是 由 McKeeman[253] 所 描述 的 。 尾 递 


归 消 除 更 加 古老 ;传说 McCarthy 在 1963 年 的 一 次 讲座 中 在 黑板 上 描述 了 这 一 方法 。Steele 的 论文 [314] 是 
尾 递归 消除 的 经 典 参考 资料 。 

稀疏 简单 常量 算法 SSCP 归 功 于 Reif 和 Lewis[285]。Wegman 和 Zadeck 重 新 形式 化 SSCP 以 使 用 SSA 形 
式 并 给 出 10.4.1 节 中 的 SCCP 算 法 [328 ，329]。 他 们 的 工作 阐明 了 乐观 算法 和 悲观 算法 之 间 的 差异 ; Click 
从 集合 构建 的 观点 讨论 了 相同 的 问题 [79] 。 

循环 优化 已 得 到 广泛 的 研究 [27，19]; Kennedy 使 用 循环 展开 来 避 开 循环 尾部 的 拷贝 操作 [202]。 
Cytron、Lowreg 和 Zadeck 提 出 了 反切 换 的 另 一 个 有 趣 的 方法 [105]。Wolf 和 Lam 把 一 组 循环 优化 统一 处 理 


为 称 为 单一 模块 (unimodular) 的 转换 [334]。McKinley 等 人 给 出 了 内 存 优化 对 性 能 的 影响 的 实践 观点 


[89, 254]。 

组 合 优化 ， 就 像 在 SCCP 中 那样 ， 通 常 导致 独立 运用 原来 的 优化 所 不 能 得 到 的 改进 。 值 编号 把 元 余 
消除 、 常 量 传播 和 代数 等 式 的 简化 结合 起 来 [50]。LCM 把 元 余 消 除 、 部 分 元 余 消 除 与 代码 移动 结合 起 来 
[215]。Click 和 Cooper[81] 把 Alpern 的 划分 算法 [20] 与 SCCP 结 合 起 来 [329]。 很 多 作者 把 寄存 器 分 配 和 指 
令 调 度 结合 起 来 [158， 267, 268, 261, 45, 274, 298]。 

操作 符 强度 减弱 已 有 相当 丰富 的 历史 。 强 度 减 弱 算 法 的 一 个 系列 就 是 来 自 于 Allen、Cocke 和 
Kennedy 的 工作 [204，83，85，18，250]。05R 算 法 就 是 这 一 系列 的 成 员 。 算 法 的 另外 一 个 系列 来 自 于 由 
LCM 算 法 所 展示 的 优化 的 数据 流 方法 ， 有 若干 资料 给 出 了 这 一 系列 中 的 技术 [118，192，198，120， 216, 
209，169]。10.3.3 节 中 的 05R 版 本 只 减弱 乘法 。Allen 等 人 展示 了 其 他 很 多 操作 符 的 减弱 序列 [18]; 扩展 
05R 以 处 理 这 些 情况 是 直截了当 的 。 

缩小 现存 代码 或 生成 更 小 的 程序 是 文献 中 永远 的 话题 。Fabri 给 出 通过 存储 覆盖 的 自动 生成 来 减 小 数 
据 内 存 需 求 的 算法 [134]。Marks 构 建 了 一 个 简洁 、 程 序 特 化 的 指令 集合 并 构建 了 该 指令 集合 的 一 个 解释 
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器 [249]。Fraser、Myers 和 Wendt 使 用 了 基于 后 缀 树 的 过 程 抽 象 [148]。 最 近 的 研究 已 集中 于 压缩 代码 以 
便 网 络 传输 [130，145] 并 直接 生成 小 代码 ; 一 些 需要 硬件 解码 器 的 帮助 [233 ，234] ， 而 另外 一 些 无 需 这 
样 的 帮助 [99]。 
代码 放置 的 现代 算法 开始 于 Pettis 和 Hansen[273]。 后 来 的 工作 包括 分 支 调整 [59, 340] 和 代码 布局 [88， 
73，156]。 这 些 优化 通过 改进 分 层 存储 器 系统 中 的 代码 内 存 行为 来 改进 性 能 。 它 们 还 消除 分 支 和 跳 转 。 
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11.1 概述 


当代 码 生 成 开始 时 ， 程 序 是 以 信 形 式 存 在 的 。 代 码 生 成 器 必须 把 这 一 IR 程 序 转换 成 在 目标 机 器 上 可 
以 运行 的 代码 。 编 译 器 必须 : (1) 选择 一 个 实现 IR 操 作 的 目标 机 器 操作 序列 ， 这 是 被 称 为 指令 筛选 
(instruction selection) 的 过 程 ; (2) 选择 操作 应 该 执行 的 顺序 ， 这 是 被 称 为 指令 调度 (instruction 
scheduling) 的 过 程 ; (3) 在 程序 每 一 点 处 决定 哪些 值 应 该 驻 留 在 寄存 器 中 ， 这 是 被 称 为 寄存 器 分 配 
(register allocation) 的 过 程 。 对 于 每 一 种 情况 ， 编 译 器 必须 重 写 代码 以 反映 这 些 决策 。 大 多 数 编译 器 分 
别处 理 这 三 种 情况 中 的 每 一 种 。 术 语 代码 生成 (code generation) 经 常 指 的 是 指令 筛选 。 本 章 研究 指令 
筛选 中 引发 的 各 种 挑战 。 下 面 两 章 将 研究 分 析 指 令 调度 和 寄存 器 分 配 。 

在 设计 代码 生成 器 时 ， 编 译 器 设计 者 必定 要 考虑 代码 的 低级 的 细节 和 它们 到 指令 集体 系 结构 (ISA) 
上 的 映射 ， 以 及 目标 机 器 的 硬件 资源 。 如 果 也 程 序 已 经 表示 某 些 或 全 部 低级 细节 ， 那 么 指令 筛选 可 以 考 
虑 这 些 细节 并 做 出 它 相 应 的 选择 。 如 果 了 IR 在 抽象 的 较 高 级 别 表示 程序 ， 那 么 指令 筛选 必须 填补 某 些 或 全 
部 细节 。( 在 编译 的 这 一 后 期 阶段 机 械 地 生成 这 样 的 细节 可 以 导致 带 有 低级 细节 定制 的 模板 式 代 码 。) 很 
少 执行 或 根本 不 执行 优化 的 编译 器 直接 从 前 端 所 产生 的 态 形 式 生 成 代码 。 

指令 筛选 的 复杂 性 来 自 于 这 样 的 事实 : 在 特定 的 目标 机 器 上 通常 存在 很 多 不 同 的 执行 给 定 计算 的 方 
法 。 我 们 暂时 抛 开 指 令 调 度 和 寄存 器 分 配 问 题 ; 我 们 将 在 下 两 章 回 到 这 些 问题 上 来 。 如 果 每 一 个 IR 操 作 
在 目标 机 器 上 恰好 只 有 一 个 实现 ， 那 么 编译 器 可 以 简单 地 把 每 一 个 这 样 的 操作 映射 到 等 价 的 机 器 操作 序 
列 上 。 然 而 ， 在 大 多 数 情 况 中 ， 目标 机 器 可 以 用 很 多 方法 实现 每 一 个 IR 结 构 。 

例如 , 在 一 台 以 ILOC 为 固有 指令 集 的 机 器 上 ,考虑 把 通用 寄存 器 r; 中 的 值 拷贝 到 另 一 个 寄存 器 rj 中 。 
正如 我 们 将 看 到 的 那样 ， 即 使 是 ILLOC 也 足以 暴露 出 代码 生成 中 很 多 问题 的 复杂 性 。mi 一 ri 的 一 个 显然 的 
实现 是 使 用 i2i rors; 通常 ， 这 样 的 寄存 器 到 寄存 器 拷贝 是 处 理 器 提供 的 最 廉价 的 操作 之 一 。 然 而 ， 
有 很 多 其 他 实现 。 例 如 包括 下 面 这 些 操作 : 


addI rouo > Vy subI 
multl ry,l > fj divI 


ri,0 => fj 
Pani => fj 





IshiftI ri,0 > rj 
orI T0 > rj 


rshiftI ri,0 > ry 
xorI i0 > rj 


还 有 一 个 使 用 andI 的 操作 ， 其 中 ，andI 的 一 个 操作 数 是 所 有 位 均 为 1 的 常数 。 如 果 处 理 器 维护 一 个 
值 总 是 零 的 寄存 器 ， 那 么 使 用 add、sub、1shift、rshift、or 和 xor 的 另 一 组 操作 也 适用 。 更 多 两 操作 
序列 也 适用 ， 包 括 一 个 存储 后 面 跟着 一 个 装 入 ， 以 及 使 用 第 3 个 寄存 器 的 一 对 xor 操 作 。 很 多 其 他 多 操作 
序列 也 是 可 能 的 。 

程序 员 将 快速 否定 绝 大 多 数 的 可 能 序列 。 使 用 i2i 简 单 、 快 速 且 显然 。 然 而 ， 自 动 过 程 也许 需 要 考 
虐 所 有 的 可 能 性 并 做 出 适当 的 选择 。 特 定 指令 集合 用 多 种 方法 实现 相同 效应 的 能 力 增 加 了 指令 筛选 的 复 
杂 性 。 对 于 ILOC，ISA 为 每 一 个 特定 效应 只 提供 几 个 简单 的 低级 操作 。 即 使 这 样 ， 它 仍然 支持 很 多 实现 





6 


寄存 器 到 寄存 器 拷贝 的 方法 。 

实际 的 处 理 器 更 加 复杂 。 它 们 可 能 包含 代码 生成 器 应 该 考虑 的 高 级 操作 和 多 寻 址 模型 。 尽 管 这 些 特 
性 允许 熟练 程序 员 或 精心 设计 的 编译 器 创建 更 高 效 的 程序 ， 但 是 它们 也 增加 指令 筛选 器 所 要 面 对 的 选择 
数量 : 它们 使 可 能 实现 的 空间 更 大 。 

每 一 个 可 选 序列 都 有 自己 的 成 本 。 大 多 数 机 器 实现 诸如 i21、add 和 1shift 这 样 的 简单 操作 ， 这 些 操 
作 在 一 个 周期 内 执行 。 有 一 些 操作 ， 例 如 整数 乘法 和 除法 ， 所 花 的 时 间 会 更 长 。 内 存 操作 的 速度 取决 于 
很 多 因素 ， 其 中 包括 计算 机 内 存 系统 的 当前 状态 细节 。 

在 某 些 情况 下 ， 一 个 操作 的 实际 代价 可 能 依赖 于 上 下 文 。 例 如 ， 如 果 处 理 器 有 若干 个 功能 单元 ， 那 
么 不 使 用 寄存 器 到 寄存 器 的 拷贝 而 使 用 一 个 在 未 加 以 利用 的 功能 单元 上 执行 的 操作 更 好 。 如 果 不 使 用 这 
一 操作 时 这 个 功能 单元 是 空闲 的 ， 那 么 从 效果 上 看 ， 这 一 操作 是 免费 的 。 把 这 一 操作 移 到 这 个 未 加 以 利 
用 的 单元 上 实际 上 加 速 整个 计算 。 如 果 代 码 生成 器 必须 把 找 贝 重 写成 只 在 未 加 以 利用 的 功能 单元 上 执行 
ERE. BAKA. SURE MESA EAE. 

在 大 多 数 情 况 下 ， 编 译 器 设计 者 想 要 后 端 产生 快速 运行 的 代码 。 然 而 ， 其 他 度量 标准 也 是 可 能 的 。 
例如 ， 如 果 最 终 的 代码 在 以 电池 供电 的 设备 上 运行 ,那么 编译 器 可 能 要 考虑 每 一 个 操作 的 一 般 能 源 消耗 。 
(各 个 操作 可 能 消耗 不 同 量 的 能 源 . ) 设法 优化 能 源 使 用 的 系统 中 的 成 本 可 能 根本 不 同 于 速度 度量 所 使 用 
的 成 本 。 能 源 成 本 很 大 程度 依赖 于 硬件 的 细节 ， 因 此 ， 这 一 成 本 也 将 随 着 处 理 器 的 实现 而 发 生变 化 。 同 
样 地 ， 如 果 代码 空间 是 重要 的 度量 标准 ， 那 么 编译 器 设计 者 可 能 只 基于 序列 长 度 指 定 成 本 。 另 外 ， 编 译 
器 设计 者 也 可 能 简单 地 拒绝 与 单一 操作 序列 产生 相同 效应 的 多 操作 序列 。 

使 问题 进一步 复杂 化 的 是 某 些 ISA 对 特定 操作 设置 额外 的 限制 。 整 数 乘法 可 能 需要 从 寄存 器 的 一 个 
子 区 域 提 取 它 的 操作 数 。 浮 点 操作 可 能 需要 它 的 操作 数 在 偶数 标号 的 寄存 器 中 。 内 存 操作 可 能 只 在 处 理 
器 的 特定 功能 单元 上 执行 。 浮 点 单元 可 能 支持 序列 r, x mi+rx 的 单一 操作 实现 ， 而 这 一 实现 比 乘法 和 加 法 
组 成 的 序列 运行 得 快 。 装 和 人 乘法 和 存储 乘法 操作 也 许 需要 相 邻 的 寄存 器 。 内 存 系统 可 能 只 对 双 字 或 四 倍 
字 长 的 装 和 发放 最 佳 带宽 和 等 待 时 间 ， 而 对 单字 装 人 则 不 发 放 最 佳 带宽 和 等 待 时 间 。 诸 如 这 样 的 约束 限 
制 指令 筛选 。 同 时 ， 它 们 也 增加 寻找 在 输入 程序 的 每 一 点 使 用 最 佳 操作 的 解决 方案 的 重要 性 。 

当 芒 和 目标 机 器 的 抽象 层次 明显 不 同时 ， 或 者 它们 的 计算 模型 不 同时 ， 指 令 乌 选 可 以 在 衔接 它们 之 
间 的 这 种 差距 中 起 重要 的 作用 。 指 令 第 选 把 民 程 序 中 的 计算 高 效 地 映射 到 目标 机 器 的 程度 通常 决定 所 生 
成 代码 的 效率 。 例 如 ， 考 虚 由 类 ILOC 的 人 R 生 成 代码 的 三 种 模式 : 

1) 简单 、 标 量 RISC 机 器 ”从 IR 到 汇编 语言 的 映射 是 直截了当 的 。 代 码 生 成 器 为 每 一 个 琢 操作 可 能 
只 考虑 一 个 或 两 个 汇编 语言 序列 。 

2) CISC 处 理 器 ”为 了 有 效 使 用 CISC 指 令 集 合 ， 编 译 器 可 能 需要 把 若干 IR 操 作 豪 合成 一 个 目标 机 器 
操作 。 

3) 栈 机 器 ”代码 生成 器 必须 把 ILOC 的 寄存 器 到 寄存 器 的 计算 风格 翻译 成 基于 栈 的 风格 ， 这 种 风格 
带 有 隐 式 名 字 并 在 某 些 情况 下 带 有 破坏 性 操作 。9 
当 耻 和 目标 1SA 之 间 的 抽象 层次 的 差距 加 大 时 ， 帮 助 构建 代码 生成 器 的 工具 的 需要 也 加 大 。 

尽管 指令 筛选 在 决定 代码 质量 中 起 着 重要 的 作用 ， 但 是 编译 器 设计 者 必须 牢记 ， 指 令 筛选 可 能 带 来 
的 巨大 的 搜索 空间 。 正 如 我 们 将 看 到 的 那样 ， 即 使 是 中 等 大 小 的 指令 集合 也 可 能 产生 包含 数 以 百 万 计 的 
状态 搜索 空间 。 显 然 ， 编 译 器 无 法 承受 以 不 周密 或 者 穷 举 的 方法 对 这 样 的 空间 进行 探索 。 我 们 所 描述 的 


O 将 单 地 址 或 栈 IR (如 字 节 码 ) 移 到 三 地 址 的 机 器 上 伴随 类 似 的 问题 。 代 码 生 成 器 必须 引入 新 的 名 字 空 间 。 
到 三 地 址 形式 的 翻译 可 能 引入 复 用 值 的 机 会 ， 而 这 又 引发 诸如 局 部 值 编号 这 样 的 新 的 优化 机 会 。 
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技术 使 用 规范 方法 探索 可 选 代码 序列 空间 ， 并 且 或 者 限制 它们 的 搜索 ， 或 者 预计 算 足 够 的 信息 来 使 深层 
搜索 更 有 效 。 


构建 可 重 定位 编译 器 


代码 生成 的 系统 方法 已 使 构建 可 重 定位 编译 器 (retargetable compiler) 成 为 可 能 。 可 重 定位 编译 器 
一 般 支 持 多 个 指令 集合 的 机 制 以 及 化 简 加 入 更 多 指令 集合 和 的 机 制 。 




















指令 筛选 与 调度 和 分 配 之 间 的 相互 作用 

后 端的 三 个 主要 的 过 程 是 指令 第 选 、 指 令 调度 和 寄存 器 分 配 。 这 三 个 过 程 都 对 生成 代码 的 质量 
有 直接 的 影响 ， 而 且 它 们 互相 作用 。 

指令 筛选 直接 改变 调度 的 过 程 。 筛 选 既 控 制 操作 所 需 的 时 间 又 控制 它 在 执行 时 使 用 的 功能 单元 。 
调度 可 能 影响 指令 筛选 。 如 果 代 码 生成 器 可 以 使 用 两 个 汇编 操作 之 一 实现 一 个 IR 操 作 ， 而 且 这 些 操 
作 使 用 不 同 的 资源 ， 那 么 代码 生成 器 可 能 需要 了 解 最 终 的 调度 以 保证 做 出 最 好 的 筛选 。 

筛选 在 若干 方面 与 寄存 器 分 配 间 相互 影响 。 如 果 目 标 机 器 拥有 统一 的 寄存 器 集合 ， 那 么 指令 得 
选 器 可 以 假设 寄存 器 的 供给 不 受 限制 ， 并 且 依 赖 于 分 配器 来 插入 使 值 适合 寄存 器 集合 的 装 人 和 存储 
操作 。 另 一 方面 ， 如 果 目 标 机 器 拥有 限制 寄存 器 使 用 的 规则 ， 那 么 筛选 器 必须 对 特定 的 物理 寄存 器 
格外 小 心 。 这 可 能 会 使 筛选 复杂 化 ， 并 且 要 预先 决定 一 些 或 所 有 的 分 配 决策 。 在 这 种 情况 下 ， 代 码 
生成 器 可 能 使 用 一 个 协同 程序 在 指令 筛选 期 间 执行 局 部 寄存 器 分 配 。 
尽量 分 离 第 选 、 调 度 和 分 配 可 以 化 简 每 一 个 过 程 的 实现 和 调试 。 然 而 ， 因 为 这 些 过 程 的 每 一 个 | 





开发 可 重 定位 编译 器 的 目标 是 最 大 化 编译 器 中 各 组 成 部 分 的 使 用 。 理 想 的 情况 是 ， 前 端 和 优化 器 需 
要 最 小 的 变化 ， 而 后 端的 大 部 分 也 可 复 用 。 从 而 充分 利用 在 构建 、 调 试 和 维护 这 个 编译 器 的 公共 部 分 上 
的 投资 。 

可 移植 性 的 现代 方法 让 指令 筛选 器 负 起 处 理 不 同 的 目标 的 责任 。 编 译 器 对 所 有 目标 ， 在 某 些 情 况 下 
对 所 有 源 语 言 使 用 共同 的 IR。5 这 一 方法 基于 在 大 多 数目 标 机 器 上 为 真 的 一 组 假设 优化 中 间 形 式 。 最 后 ， 
编译 器 设计 者 设法 分 离 并 提取 目标 相关 细节 来 创建 后 端 。 

(因为 调度 器 和 寄存 器 分 配器 操作 于 目标 机 器 的 汇编 代码 ， 所 以 编译 器 的 这 些 部 分 需要 目标 相关 的 
信息 。 这 一 信息 包括 操作 等 待 时 间 、 寄 存 器 单元 的 大 小 、 功 能 单元 的 数量 和 能 力 、 调 整 限制 、 目 标 机 器 
的 调用 约定 以 及 其 他 种 类 的 细节 。 但 是 ， 即 便 如 此 ， 编 译 器 在 整个 平台 上 分 享 基础 算法 和 实现 。) 

. 构建 可 重 定 位 编译 器 的 最 重要 一 点 在 于 指令 筛选 器 的 自动 构造 。 图 11-1 给 出 一 个 可 能 的 系统 。 这 一 
指令 筛选 器 是 由 与 一 组 表格 结合 在 一 起 的 模式 匹配 引擎 组 成 的 ， 这 些 表格 编码 从 IR 到 目标 ISA 的 映射 所 
需 的 必要 信息 。 结 果 筛 选 器 消耗 编译 器 的 IR 并 为 目标 机 器 产生 汇编 代码 。 在 这 样 的 系统 中 ， 编 译 器 设计 
者 创建 目标 机 器 的 描述 并 运行 后 端 生成 器 ， 有 时 称 为 代码 生成 器 生成 器 (code-generator generator)。 而 
后 端 生成 器 使 用 这 一 描述 得 到 模式 匹配 器 所 需 的 表格 。 像 分 析 器 生成 器 一 样 ， 后 端 生成 器 在 编译 器 开发 
过 程 中 脱 机 运行 。 因 此 ， 我 们 可 以 使 用 算法 来 创建 比 长 时 间 的 编译 需要 更 多 时 间 的 这 一 表格 。 

尽管 我 们 的 目标 是 分 离 指令 筛选 器 、 调 度 器 和 寄存 器 分 配器 中 的 所 有 机 器 相关 代码 ， 但 是 现实 几乎 
总 不 是 那么 理想 。 某 些 机 器 相关 细节 不 可 避免 地 渗透 到 编译 器 的 早期 部 分 。 例 如 ， 活 动 记 录 的 调整 限制 


O 在 实践 中 ， 新 语言 的 加 入 通常 意味 着 给 了 杖 增加 一 些 新 的 操作 。 然 而 ， 目 标 是 扩展 了 极 而 不 是 重新 确立 它 。 
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可 能 因 目标 机 器 的 不 同 而 不 同 ， 这 改变 存储 在 ARS 中 的 值 的 偏 移 。 如 果 编 译 器 要 充分 利用 诸如 预测 执行 、 
分 支 等 待 槽 和 多 字 内 存 操作 ， 那 么 它 也 许 需要 显 式 地 表现 这 些 特性 。 然 而 ， 尽 量 把 目标 相关 的 细节 注入 





后 端 生成 器 





图 11-1 一 个 可 重 定位 的 后 端 


本 章 研 究 两 个 指令 筛选 器 自动 构造 法 。 下 一 节 介绍 指令 筛选 的 简单 树 遍历 算法 ， 并 以 此 对 这 一 问题 
给 出 详细 的 介绍 。 随 后 两 节 给 出 运用 模式 匹配 技术 把 IR 序 列 转换 成 汇编 序列 的 各 种 方法 。 这 两 个 方法 都 
是 基于 描述 的 。 编 译 器 设计 者 以 形式 表 记 法 描述 目标 机 器 的 ISA， 然 后 ， 我 们 使 用 一 个 工具 构建 编译 时 
使 用 的 模式 匹配 指令 筛选 器 。 二 者 都 已 用 于 成 功 的 可 移植 编译 器 上 。 

第 一 个 技术 使 用 树 模式 匹配 理论 来 创建 自 底 向 上 的 重 写 系统 。 至 少 在 概念 上 ， 这 一 技术 假设 编译 器 
使 用 类 似 于 树 的 IR。 编 译 器 设计 者 使 用 类 似 于 低级 抽象 语法 树 的 树 型 模式 描述 目标 机 器 的 ISA。 每 一 个 
模式 采用 以 值 和 实现 子 树 的 相关 汇编 序列 替换 这 一 子 树 的 重 写 规则 的 形式 。 模 式 匹 配器 发 现 把 一 个 人 树 
归 约 成 单一 值 的 一 个 重 写 序 列 ; 第 二 遍 跟 踪 这 一 重 写 序列 并 发 行 相关 的 代码 。 

第 二 个 技术 采用 一 个 众所周知 的 优化 技术 ， 客 孔 优化 (peephole optimization)， 并 把 这 一 优化 技术 
用 于 代码 生成 。 窥 孔 优化 器 从 一 组 模式 库 出 发 ， 它 识别 并 改进 这 些 模式 的 实例 。 至 少 在 概念 上 ， 它们 工 
作 于 线性 及 上 。 它 们 把 注意 力 局 限于 操作 的 一 个 小 窗口 一 - 窥 孔 。 这 简化 模式 匹配 并 提高 模式 匹配 的 速 
度 。 它 们 也 限制 能 够 发 现 的 匹配 集合 。 基 于 察 孔 的 指令 筛选 从 20 世 纪 80 年 代 早 期 已 经 开始 使 用 。 通 过 为 
每 一 个 下 结构 构建 一 个 将 其 重 写成 目标 机 器 的 汇编 代码 的 规则 ， 编 译 器 设计 者 可 以 使 窥 孔 优化 器 使 用 
个 汇编 程序 替换 下 程序 。 增 加 模式 通常 可 以 改进 代码 质量 。11.4 节 将 更 详细 地 讨论 这 一 方法 。 


11.2 简单 的 树 遍 历 方案 
为 了 使 讨论 更 具体 ， 考 虑 为 诸如 w<-x-2 x y 这 样 的 赋值 语句 生成 代码 时 出 现 的 问题 。 这 一 赋值 语句 
可 以 表示 成 AST 的 形式 ， 如 下 图 左边 所 示 ， 或 表示 成 一 个 四 元 组 表 ， 如 下 图 右边 所 示 。 

eas 
Cae 

Z 天 操作 符 Arg, Arg, 结果 
” x x 2 y ti 

ZAN 和 


2 y uc x W 
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指令 筛选 必须 从 上 述 两 个 IR 表 示 产 生 一 个 汇编 语言 的 程序 。 出 于 讨论 的 缘故 ， 假 设 它 必须 生成 如 图 
11-2 所 示 的 ILOC 子 集中 的 操作 。 


算术 运算 存储 器 操作 
Th > m store => re 
risCe = V3 storeA0 => 2,3 
rir: > "3 storeAI => 12,03 
risc: > r3 loadI => 73 


rz = 93 load => 73 
Tit, > 13 1oadA0 rierz => r3 
T1,Cg > 13 loadAI T1,C2 > 13 





图 11-2 ILOC 子 集 
在 第 ?7 章 中 ， 我 们 已 经 看 到 一 个 可 以 从 表达 式 的 AST 生 成 代码 的 简单 树 遍历 例 程 。 图 7-2 中 的 代码 处 
理 作 用 于 变量 和 数字 的 二 元 操作 符 + 、- 、x 和 + 上 。 它 为 表达 式 生 成 朴素 代码 并 力图 说 明 可 以 用 于 生成 
低级 线性 IR 或 简单 RISC 机 器 的 汇编 代码 的 方法 。 


n 
A 
nN 


Mie ET MATRA, CRAENE MERAH ELS. MRIRG HBT 
支 有 两 个 明确 的 分 支 目 标 ， 如 ILOC 那 样 ， 那 么 编译 器 可 以 选择 在 内 存 中 把 一 个 块 的 其 中 一 个 逻辑 后 
继 放 在 其 后 。 只 使 用 一 个 显 式 分 支 目标 ， 这 通常 称 为 落下 分 支 (fall-through branch)， 对 基本 块 进 
行 重新 布局 需要 更 多 的 工作 。 | 


在 体系 结构 上 ， 有 两 种 可 以 左右 这 一 决策 的 考虑 。 对 于 某 些 处 理 器 ,采用 分 支 需要 比 落 下 到 下 
| 一 个 操作 需要 更 多 的 时 间 。 在 带 有 高 速 缓 冲 存储 器 的 机 器 上 ， 一 起 执行 的 块 应 该 放置 在 一 起 。 两 种 
考 虚 都 欢迎 同样 的 布局 策略 。 如 果 块 a 结束 于 以 8 和 c 为 目标 的 分 支 ， 那 么 编译 器 应 该 在 内 存 中 在 a 之 
后 放置 更 频繁 采用 的 目标 。 

当然 ， 如 果 一 个 块 在 控制 流 图 中 有 多 个 前 驱 ， 那 么 它们 中 只 有 一 个 能 在 内 存 中 直接 领先 于 它 。 
而 其 他 前 驱 将 需要 一 个 分 支 或 跳 转 来 达到 它 。 














这 一 简单 树 遍历 方法 为 特定 AST 结 点 类 型 的 每 一 个 实例 生成 相同 的 代码 。 尽 管 这 产生 正确 的 代码 ， 
但 是 它 从 不 利用 这 一 机 会 制作 特定 环境 和 上 下 文 下 的 代码 。 如 果 编 译 器 在 指令 筛选 之 后 执行 有 意义 的 优 
化， 那么 这 也 许 不 成 问题 。 然 而 ， 在 没有 后 继 优化 的 情况 下 ， 最 终 的 代码 很 可 能 包含 显然 低 效 的 地 方 。 
例如 ， 考 虑 简单 树 遍 历 例 程 处 理 变量 和 数字 的 方式 。 相 应 情况 的 代码 是 : 


case IDENT: case NUM: 
tl +- base(node),; result +- NextRegister(); 
t2 +- offset(nade); emit (toadI, val(node), 
result — NextRegister(); none, result); 
emit (loadAQ, t1, t2, result); break; 
break; 


对 于 变量 ， 这 一 代码 依赖 于 两 个 例 程 base 和 offset 来 得 到 进入 寄存 器 的 基地 址 和 偏 移 。 然 后 ， 它 发 行 
1oadA0 对 基地 址 和 偏 移 求 和 来 生成 一 个 有 效 地 址 并 取 回 在 内 存 这 一 有 效 地 址 处 的 内 容 。 因 为 AST 不 区 分 1553 
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变量 的 存储 种 类 ， 所 以 base 和 offset 可 能 要 参考 符号 表 得 到 它们 所 需 的 额外 信息 。 

把 这 一 方案 扩展 到 更 现实 的 情况 ， 包 含有 不 同 大 小 表示 的 变量 、 值 调用 和 引用 调用 参数 以 及 在 整个 
生存 期 都 驻 留 在 寄存 器 中 的 变量 ， 将 需要 写 出 检查 每 一 次 引用 的 每 一 种 情况 的 明确 代码 。 这 将 使 得 
IDENT 情 况 的 代码 更 长 (而 且 更 慢 )。 它 消除 手工 编码 树 遍 历 方案 的 大 部 分 引人入胜 的 简洁 性 。 

处 理 数 的 代码 同样 是 不 成 熟 的 。 这 一 代码 假设 一 个 数 在 每 一 个 种 情况 下 都 应 该 被 装 入 到 寄存 器 中 ， 
并 假设 va7 能 够 从 符号 表 中 取得 这 个 数 的 值 。 如 果 使 用 这 一 数 的 操作 ( 它 在 树 中 的 父 结 点 ) 在 目标 机 器 
上 有 立即 形式 ， 而 且 常 量 的 值 适合 它 的 立即 域 ， 那 么 编译 器 应 该 使 用 这 一 立即 形式 ， 因 为 这 样 可 以 少 用 
一 个 寄存 器 。 如 果 这 个 数 是 立即 操作 不 支持 的 类 型 ， 那 么 编译 器 必须 设法 在 内 存 中 存储 这 个 值 ， 并 生成 
一 个 适当 的 内 存 引用 把 这 个 值 装 入 一 个 寄存 器 中 。 从 而 ， 这 将 创建 进一步 改进 的 机 会 ， 例 如 将 这 个 常量 
值 保留 在 寄存 器 中 。 . . 

为 了 使 这 一 讨论 具体 化 ,考虑 图 11-3 所 示 的 三 个 乘法 操作 。 符 号 表 注释 现 显 在 树 中 时 结 点 的 下 方 。 
对 于 标识 符 ， 它 是 由 一 个 名 字 、 一 个 基地 址 标签 (或 表明 当前 活动 记录 的 ARP) 以 及 距离 基地 址 的 偏 移 
组 成 的 。 每 一 棵 树 的 下 方 有 两 个 代码 序列 : 由 简单 树 遍 历 评估 器 生成 的 代码 序列 和 我 们 希望 编译 器 生成 
的 代码 序列 。 在 第 一 种 情况 的 a x b 中 ， 低 效 性 来 自 于 树 遍 历 方案 不 生成 10adAI 操 作 。IDENT 情 况 中 更 复 
杂 的 代码 可 以 解决 这 一 问题 。 


cxd 


x 


IDENT IDENT IDENT | NUM IDENT Spent 
(a,ARP,4) (b,ARP,8) (a,ARP,4) (2) (c, @G,4) (d,@H, 4) 


生成 代码 


loadl @G 和 rs 


loadI 4 => fs loadI 4 => rs 
loadI 4 => 1s 

loadA0 rarpsrs = T6 loadAO rs,re => r7 
ToadAO rarpsrs => rs 

loadI 8 => 17 1oadI @H = r3 
loadI 2 ry 

1oadA0 rarpsr7y => ra loadI 4 => rg 
mult re,ry => Ve 

mult rore => Vo loadAO rg,rg = Pio 


mult rr > Pu 


预期 代码 


1oadI 4 => T5 
loadAI rarp,4 => rs loadAI rs, ,@G = re 
multI rs,2 => r% loadAI rs,@H = ry 


ToadAI rarp4 => rs 
1oadAI rarp,8 => re 


mult rs re => 7 
mult rery => rs 





图 11-3 乘法 种 类 


第 二 种 情况 的 a x 2 比较 麻烦 。 代 码 生 成 器 可 能 使 用 multI 操 作 实 现 乘 法 。 然 而 ， 为 了 识别 这 一 事实 ， 
代码 生成 器 必须 查看 这 一 局 部 上 下 文 之 外 的 上 下 文 。 为 了 在 树 遍历 方案 中 实现 这 一 功能 ， 对 于 x 的 这 一 
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情况 可 能 识别 出 评估 到 常量 的 一 棵 子 树 。 或 者 ， 处 理 NUM 结 点 的 代码 可 能 确定 它 的 父 结 点 可 以 使 用 立即 
操作 来 实现 。 无 论 哪 种 方法 ， 它 都 需要 非 局 部 上 下 文 而 非 局 部 上 下 文 破坏 简单 树 遍历 范例 。 
第 三 种 情况 的 c x d 有 另 一 种 非 局 部 问题 。 x 的 两 棵 子 树 都 引用 距 基地 址 偏 移 为 4 处 的 变量 。 这 一 引用 
有 不 同 的 基地 址 。 原 来 的 树 亡 历 方案 为 每 一 个 常量 生成 一 个 明确 的 1oadI 操 作 : e6、4、eh 和 4。 正 如 前 面 
所 提 到 那样 ， 使 用 10adAI 的 修改 版 本 将 为 e668 和 eH 生成 不 同 的 10adI 或 者 它 将 为 4 生成 两 个 10adI1。( 当然 ， 
ee 和 eH 的 值 的 长 度 开始 发 挥 作用 。 如 果 它 们 太 长 ， 那 么 编译 器 必须 把 4 作为 10adAI 操 作 的 立即 操作 数 . ) 
第 三 个 例子 的 基本 问题 在 于 最 终 的 代码 包含 一 个 隐藏 在 AST 中 的 公共 子 表达 式 。 为 了 发 现 这 个 宛 余 并 
适当 处 理 它 ， 代 码 生成 器 将 需要 显 式 检查 子 树 基 地 址 和 偏 移 值 的 代码 ， 并 为 所 有 情况 生成 适当 的 序列 。 以 
这 种 方式 对 一 种 情况 进行 处 理 将 是 很 策 拙 的 。 对 可 能 出 现 的 所 有 类 似 情况 进行 处 理 将 需要 较 少 的 附加 编码 。 
处 理 这 种 元 余 的 更 好 方法 是 揭示 形 中 的 元 余 细节 ， 并 让 编译 器 来 消除 它们 。 对 例子 中 的 赋值 wx- 
2 xy， 前 端 会 产生 如 图 11-4 所 示 的 低级 树 。 这 棵 树 有 若干 种 新 结 点 。Val 结 点 代表 已 知 驻 留 在 寄存 器 中 
的 值 ， 例 如 ，rsm 中 的 ARP。Lab 结 点 代表 可 重 定位 的 符号 ， 一 般 是 e 
用 于 代码 或 数据 的 汇编 级 标签 。 争 结 点 表示 间接 层次 ; 它 的 子 结 点 “oN 
PALA OER IR TOU BRE IER 
编译 器 设计 者 指定 更 多 的 匹配 规则 。 然 而 ， 反 过 来 ， 附 加 的 细节 可 Val num 4 x 
以 用 于 诸如 在 c x d 中 优化 4 的 重复 引用 。 l N 
上 述 这 棵 树 的 这 一 版 本 比 目 标 LIOC 指 令 集 合 揭示 更 低级 别 的 细 | 
节 。 例 如 ， 检 查 这 棵 树 揭示 w 是 存储 在 距 ARP 偏 移 为 4 的 局 部 变量 ， + 


而 x 是 一 个 引用 调用 参数 (注意 那 两 个 多 结 点 ) yRR RET RRS ff Ye 
e@6 偏 移 为 12 的 地 方 。 另 外 ， 隐 含 于 1oadAI 和 storeAI 操 作 中 的 加 法 显 aP -16 @G 12 
式 地 出 现在 这 棵 树 上 ， 作 为 仿 结 点 的 子 树 或 一 结 点 的 左 子 结 点 。 图 11-4 wex-2 xy 的 低级 AST 


在 AST 中 揭示 更 多 细节 将 导致 更 好 的 代码 。 增 加 代码 生成 器 所 考虑 的 目标 机 器 的 操作 数量 也 将 导致 
更 好 的 代码 。 然 而 ， 把 这 些 因素 结合 起 来 创建 这 样 一 种 情况 ， 在 这 里 ， 代 码 生成 器 可 以 发 现 很 多 实现 给 


定子 树 的 不 同方 法 。 这 一 简单 树 遍 历 方案 对 每 一 种 AST 结 点 类 型 都 有 一 个 选项 。 为 了 高 效 使 用 目标 机 器 


指令 集合 ， 代 码 生 成 器 将 尽 可 能 考虑 更 多 可 用 的 可 能 性 。 





| 最 优 代码 的 生成 
| 乌 选 指令 的 树 遍历 方案 每 当 遇 到 特定 种 类 的 AST 结 点 时 生成 相同 的 代码 序列 。 更 现实 的 方案 考 | 
| 虑 多 个 模式 并 使 用 成 本 模型 来 在 它们 中 间 做 出 选择 。 很 自然 ， 这 将 引发 这 样 一 个 问题 ， 编 译 器 能 够 | 
| 做 出 最 优选 择 吗 ? | | 
”如果 每 一 个 操作 有 相应 的 成 本 ， 而 且 我 们 忽视 指令 调度 和 寄存 器 分 配 的 效应 ， 那 么 最 优 指令 得 | 
| 选 是 可 能 的 。11.3 节 中 所 述 的 树 模式 匹配 代码 生成 器 生成 局 部 最 优 序 列 ， 即 每 一 棵 子 树 由 最 小 代价 | 

的 序列 计算 。 | 


| 以 单一 成 本 数 刻画 运行 时 行为 的 困难 引起 对 这 一 主张 的 重要 性 的 疑问 。 执 行 顺 序 、 有 限 硬 件 | 
资源 以 及 内 存 层次 中 的 上 下 文 相关 行为 的 影响 都 将 使 确定 任意 特定 代码 序列 的 实际 成 本 的 问题 变 | 
| 得 复杂 。 | 
在 实践 中 ， 大 多 数 现 代 编 译 器 在 指令 筛选 期 间 很 大 程度 上 忽视 调度 和 分 配 的 效应 。 并 假定 与 各 
个 重 写 规则 相关 的 代价 是 精确 的 。 考 虑 到 这 些 假定 ， 编 译 器 寻找 局 部 最 优 序列 ， 即 最 小 化 整 标 子 树 
| 的 评估 代价 的 序列 。 然 后 ， 编 译 器 在 由 指令 筛选 所 生成 的 代码 上 执行 一 亡 或 多 所 调度 和 分 配 。 
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这 增加 的 复杂 性 并 不 是 由 特定 方法 或 特定 的 匹配 算法 引起 的 ， 而 是 由 于 它 反映 了 实际 情况 : Be 
的 机 器 可 能 提供 很 多 实现 IR 结 构 的 不 同方 法 。 当 代码 生成 器 考虑 给 定子 树 的 多 种 可 能 匹配 时 ， 它 需要 
在 它们 中 间 做 出 选择 的 方法 。 如 果 编 译 器 设计 者 可 以 为 每 一 个 模式 附加 一 个 代价 ， 那 么 这 一 匹配 方案 
可 以 以 最 小 化 代价 的 方式 选择 模式 。 如 果 代价 真实 地 反映 性 能 ， 那 么 这 种 代价 驱动 指令 筛选 将 导致 更 
好 的 代码 。 

编译 器 设计 者 需要 一 个 工具 来 帮助 管理 现实 机 器 的 代码 生成 复杂 性 。 编 译 器 设计 者 不 编写 出 明确 导 
航 IR 并 测试 每 一 操作 的 可 用 性 的 代码 ， 而 是 编写 描述 规则 ， 而 这 些 工 具 将 生成 把 这 些 规则 与 代码 的 玉 形 
式 匹 配 所 需 的 代码 。 下 面 两 节 讨 论 两 种 管理 现代 机 器 的 指令 集合 中 所 出 现 的 复杂 问题 的 方法 。 下 一 节 讨 
论 树 模式 匹配 技术 的 使 用 。 这 些 系统 把 复杂 性 融入 构建 匹配 器 的 过 程 中 ， 正 如 扫描 器 把 它们 的 选择 融入 
DFA 的 转换 表 中 一 样 。 后 面 的 一 节 将 研究 分 析 指 令 乌 选中 帘 孔 优化 的 使 用 。 基 于 窥 孔 的 系统 把 选择 的 复 
杂 性 转化 成 一 个 统一 的 方案 ， 这 一 方案 先 做 低级 化 简 ， 然 后 寻找 适当 指令 的 模式 匹配 。 为 了 保持 匹配 成 
本 处 于 较 低 的 水 平 ， 这 些 系统 把 它们 的 作用 域 局 限 在 短 的 代码 段 上 : 一 次 只 处 理 两 三 个 操作 。 


11.3 通过 树 模式 匹配 实现 指令 筛选 


编译 器 设计 者 可 以 使 用 树 模式 匹配 工具 处 理 指令 筛选 的 复杂 性 。 为 了 把 代码 生成 转换 成 树 模 式 匹配 ， 
程序 的 IR 形 式 和 目标 机 器 指令 集合 必须 被 表示 成 树 的 形式 。 正 如 我 们 已 看 到 的 那样 ， 编 译 器 可 以 使 用 低 
级 AST 作 为 被 编译 代码 的 细节 模型 。 它 可 以 使 用 类 似 的 树 表示 目标 处 理 器 上 可 用 的 操作 。 例 如 ，ILOC 
的 加 法 操作 可 以 用 如 下 形式 的 操作 树 来 模型 化 : 


Pe Pky 
rm Vj ri Cy 


add Tistj = Tk addI Tis Cj => rk 


通过 系统 地 把 操作 树 与 AST 的 子 树 进行 匹配 ， 编 译 器 可 以 发 现 这 一 子 树 的 所 有 可 能 实现 。 

为 了 使 用 树 模式 ， 我 们 需要 描述 它们 的 更 便利 的 表 记 法 。 使 用 前 缀 表 记 法 ， 我 们 可 以 把 add 的 操作 
树 写 成 tr，rj)， 而 把 addI 的 操作 树 写 为 + (rm ，cj)。 这 一 操作 树 的 叶子 对 操作 数 存 储 类 型 的 相关 信息 
加 以 编码 。 例 如 ， 在 +(r,，cJ) 中 ， 符 号 r 表 示 在 寄存 器 中 的 一 个 操作 数 ， 而 符号 c 表 示 一 个 已 知 常量 操 
作 数 。 我 们 添加 下 标 来 保证 惟一 性 ， 就 如 我 们 在 属性 文法 的 规则 中 所 做 的 那样 。 如 果 我 们 以 前 级 形式 重 
写 图 11-4 的 AST 的 话 ， 它 变 成 : 


(+(Vali Num), —(@(@(+(Valz, Numz))), x(Num, @(+(Lab;,Num))))), 


虽然 画 出 树 来 更 加 直观 ， 但 是 这 一 线性 前 缀 形式 包含 相同 的 信息 。 

给 定 AST 和 操作 树 的 集合 ， 我 们 的 目标 是 通过 把 操作 树 铺盖 在 AST 上 来 把 这 个 AST 映 到 操作 上 。 铺 
盖 是 序 对 <ast-node ，op-tree> 的 集合 ， 其 中 ast-node 是 AST 中 的 一 个 结 点 ， 而 op-tree 是 一 棵 操作 树 。 在 一 
个 铺盖 中 序 对 <ast-node ，op-tree> 的 存在 意味 着 对 应 于 op-tree 的 目标 机 器 操作 可 以 实现 ast-node。 当 然 ， 
ast-node 的 实现 的 选择 依赖 于 它 的 子 树 的 实现 。 对 于 ast-node 的 每 一 棵 子 树 ， 铺 盖 刻 画 与 op-tree 相 关联 的 
一 个 实现 。 

一 个 铺盖 实现 AST， 如 果 它 实现 每 一 个 操作 而 且 每 一 块 “ 瓦 ” 与 它 的 邻居 “相连 结 ” 。 对 于 每 一 个 
<ast-node ，op-tree>， 我 们 说 一 个 块 瓦 与 它 的 邻居 连接 ， 如 果 或 者 ast-node 是 AST 的 根 ， 或 者 ast-node 被 
这 一 铺盖 中 的 另 一 个 op-tree 的 叶子 所 覆盖 。 在 两 个 这 样 的 树 交 迭 的 地 方 (在 ast-node )， 它 们 必须 在 公共 
结 点 的 对 应 值 的 存储 位 置 上 达成 一 致 。 如 果 二 者 都 假设 它 在 寄存 器 中 ， 那 么 这 两 个 op-tree 的 代码 序列 是 
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相 容 的 。 如 果 一 个 假设 它 在 内 存 中 ， 而 另 一 个 假设 它 在 寄存 器 中 ， 那 么 这 两 个 op-tree 的 代码 序列 是 不 相 
容 的 ， 因 为 它们 不 能 正确 地 把 由 较 低 的 树 产 生 的 值 传送 到 上 方 树 的 叶子 上 。 

给 定 实现 AST 的 铺盖 ， 编 译 器 能 够 很 容易 地 在 自 底 向 上 的 遍历 中 生成 汇编 语言 。 因 此 ， 使 这 一 方法 
更 实用 的 关键 在 于 算法 能 够 快速 地 发 现 AST 的 好 铺盖 。 已 出 现 若 和 于 对 低级 AST 进 行 树 模式 匹配 的 技术 。 
所 有 这 些 系统 都 为 每 一 棵 操作 树 关 联 一 个 代价 ， 并 生成 最 小 代价 铺盖 。 它 们 因 用 于 匹配 中 的 技术 的 不 同 
而 不 同 ， 这 些 技术 包括 树 匹配 、 文 本 匹配 以 及 自 底 向 上 的 重 写 系统 ， 还 因 它 们 的 代价 模型 的 一 般 性 不 同 
而 不 同 ， 代 价 模型 包括 静态 固定 的 代价 模型 以 及 在 匹配 过 程 中 可 以 发 生变 化 的 代价 模型 。 


11.3.1 重 写 规则 


编译 器 设计 者 把 AST 中 的 操作 树 及 子 树 之 间 的 关系 编码 成 一 组 重 写 规则 (rewrite rule )。 这 一 规则 集 
合 对 这 个 AST 中 的 每 一 种 结 点 包含 一 个 或 多 个 规则 。 一 个 重 写 规则 是 由 树 文法 中 的 一 个 产生 式 、 一 个 代 
码 模 板 和 一 个 相关 的 代价 组 成 的 。 图 11-5 给 出 使 用 ILOC 操 作 铺 盖 低 级 AST 的 重 写 规则 集合 。 


PER R fr 代码 模板 
Goal -> Assign 
Assign — + (Reg,,Reg2) 
Assign + + (+ (Reg,,Regz), Regs) 
Assign + 二 (+ (Regi, Num), Regs) 
Assign 一 + (+ (Num,,Regz), Regs) 


store rz 
storeA0 r3 
storeAl r3 
storeAl rs 


Reg 一 Lab; ioadI l 
Reg 一 Val, 


Reg 一 Num, loadl ni 


O Onn OP WD m 


load ri 

loadA0 ri r 
loadAI ri,nz 
loadAl rz,ni 
loadAl 1,12 
loadAl rz,11 


Reg — © (Regi) 

Reg ~ @ (+ (Regi,Reg2)) 
Reg > © (+ (Regı,Num)) 
Reg ~ © (+ (Num ,Regz)) 
Reg > © (+ (Reg,,Lab2)) 
Reg ~ @ (+ (Labl,Reg2)) 


Reg 一 + (Regi, Regz) 
Reg ”一 + (Regi,Numz) 
Reg ”一 + (Num ,Regz2) 
Reg — + (Regi,Labz) 
Reg — + (Lab, ,Reg2) 


ae 过 
Powe Oo 


pi 
a 


add Tisrz 
addI Tisz 
addI rz ,nl 
addI Viele 
addI T2511 


= to 
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Reg ”一 — (Reg),Rege) 
Reg — (Reg; , Num) 
Reg — (Num ,Regz) 


sub ris r2 


N 
= 


subI T1 Ne 


N 
N 


rsubI rz,ni 


N 
o 


Reg x (Reg, ,Reg2) 
Reg (Reg; , Num, ) 
Reg (Num; ,Regz) 


mult Tl"? 
multI ri,nz 
multi T21 


to 
a 


0 
1 
i 
1 
1 
1 
0 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
l 
1 
1 
1 
1 
1 
1 
1 


{$e HU YUU HR YH HUY Y 


N 
a 





图 11-5 使 用 ILOC 铺 盖 低 级 树 的 重 写 规则 
考虑 规则 16。 它 描述 计算 定位 于 Reg 中 的 一 个 值 与 Num 中 的 一 个 立即 值 的 和 的 树 。 表 的 左边 给 出 这 一 
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规则 Reg->+(Reg;，Numz) 的 树 模式 。 中 间 一 列 列 出 它 的 代价 1。 右 边 一 列 给 出 一 个 实现 这 一 规则 的 ILOC 
操作 addI r，，ns==roow。 这 一 树 模式 中 的 操作 数 Reg 和 Nums 对 应 于 这 一 代码 模板 中 的 操作 数 让 和 ns。 编 译 
器 必须 用 被 分 配 保存 这 一 加 法 结果 的 寄存 器 名 字 重 写 这 一 代码 模板 中 的 域 rno。 而 这 一 寄存 器 的 名 字 又 
将 成 为 连结 到 这 一 子 树 的 子 树 的 叶子 。 

这 一 树 模式 的 线性 形式 所 显示 的 直观 性 不 如 树 表 示 。 在 下 面 的 讨论 中 ， 我 们 常常 使 用 
图 的 形式 来 表示 模式 。 例 如 ， 下 图 表示 规则 16， 在 十 结 点 处 的 它 的 结果 隐 式 地 是 一 个 Reg。 

图 11-5 给 出 的 树 文法 与 我 们 用 于 描述 程序 设计 语言 的 语法 的 文 靶 类 似 。 每 一 个 重 写 规则 ， 或 产生 式 
的 左 部 都 是 一 个 非 终结 符 。 在 规则 16 中 ， 这 一 非 终结 符 是 Reg。Reg 表 示 树 文法 能 够 生成 的 子 树 的 一 个 集 
合 ， 对 于 这 一 情况 ， 是 使 用 规则 6 到 规则 25 生 成 的 子 树 集合 。 一 个 规则 的 右 部 是 一 个 线性 化 了 的 树 模式 。 
对 于 规则 16， 这 个 线性 化 了 的 树 模式 是 +(Reg:，Num) ， 表 示 两 个 值 Reg 和 Num 的 加 法 。 

这 一 文法 中 的 非 终 结 符 允许 抽象 。 它 们 负责 连结 文法 中 的 规则 。 它 们 还 编码 运行 时 对 应 值 的 存储 位 
置 及 采用 形式 的 信息 。 例 如 ，Reg 表 示 一 个 由 一 棵 子 树 产生 的 且 存 储 于 一 个 寄存 器 的 值 ， 而 Va1 则 表示 已 
经 在 寄存 器 中 的 一 个 值 。Va1 可 以 是 一 个 全 局 值 ，ARP 就 是 如 此 。 它 也 可 能 是 在 一 棵 不 相交 的 子 树 上 ， 
即 一 个 公共 子 表 达 式 上 ， 所 执行 的 计算 的 结果 。 

与 一 个 产生 式 相关 联 的 代价 应 该 为 代码 生成 器 提供 运行 时 在 这 一 模板 中 执行 这 一 代码 的 真实 估 测 。 
对 于 规则 16， 代 价 1 表明 使 用 需要 一 个 执行 周期 的 单一 操作 就 可 以 实现 这 棵 树 。 代 码 生成 器 使 用 这 些 代 
价 在 各 种 可 能 的 选择 中 做 出 选择 。 某 些 匹配 技术 把 代价 限制 到 数值 上 。 而 其 他 匹配 技术 则 允许 代价 在 匹 
配 期 间 发 生变 化 ， 以 反映 前 面 的 选择 对 当前 选择 的 代价 的 影响 。 

树 模式 可 以 以 简单 树 妃 历代 码 生成 器 所 无 法 做 到 的 方式 捕获 上 下 文 。 规 则 10 到 规则 14 中 的 每 一 个 
都 匹配 两 个 操作 符 〈 争 和 + )。 这 些 规则 显示 可 以 使 用 LOC 操作 符 10adA0 和 10adAI 的 条 件 。 树 遍历 代 
码 生成 器 一 次 只 匹配 一 个 操作 符 。 与 这 些 规则 之 一 匹配 的 任意 子 树 都 能 够 通过 与 其 他 规则 的 结合 而 被 
铺盖 。 与 规则 10 匹 配 的 子 树 能 够 通过 与 产生 一 个 地 址 的 规则 15 和 装 信 这 个 值 的 规则 9 结合 而 被 铺盖 。 这 
一 机 动 性 使 得 重 写 规则 集合 具有 歧义 性 。 歧 义 性 反映 了 这 样 的 事实 : 目标 机 器 具有 若干 实现 这 一 特定 
子 树 的 方法 。 | 

在 图 11.5 中 ，Reg 既 作为 终止 符 又 作为 非 终结 符 出 现 。 这 反映 本 例 中 的 一 个 缩写 规 ll 。 
则 的 完整 集合 将 包含 用 特定 寄存 器 名 重 写 Reg 的 产生 式 集合 ,诸如 Reg>ro、 Rer, = jo | 
Reg—r,. IN i 

为 了 把 这 些 规则 运用 于 一 棵 树 ， 我 们 寻找 把 这 棵 树 归 约 成 一 个 符号 的 重 写 步骤 序 ab z 
列 。 对 于 一 个 表示 完整 程序 的 AST， 这 个 符号 应 该 是 目标 符号 。 对 于 一 个 内 部 结 点 ， 那 
个 符号 一 般 表示 以 评估 以 这 一 表达 式 为 根 的 子 树 所 产生 的 值 。 这 一 符号 还 必须 指定 这 个 
值 存在 的 地 方 : 一 般 是 在 一 个 寄存 器 中 、 在 一 个 内 存 位 置 ， 或 者 是 一 个 常量 值 。 

例如 ， 考 虑 表示 对 图 11-4 中 的 y 的 引用 的 子 树 ， 这 一 子 树 就 是 图 11-6 中 最 左边 的 版 面 所 给 出 的 图 。 
(回想 一 下 ，y 处 于 距 标签 66 偏 移 为 12 的 地 方 。) 图 11-6 的 其 余 版 面 给 出 这 一 子 树 的 一 个 归 约 序列 。 在 这 
一 序列 中 的 第 一 个 匹配 发 现 左 叶子 (Lab 结 点 ) 匹配 规则 6。 这 允许 我 们 把 这 个 左 叶子 重 写成 一 个 Reg。 
现在 ， 这 一 重 写 了 的 树 与 规则 11 的 右 部 争 〈+(Reg，Num) ) 匹配 ， 所 以 我 们 能 够 把 以 令 为 根 的 整个 子 树 
重 写 为 一 个 Reg。 因 此 ， 重 写 序列 <6，11> 把 整个 子 树 归 约 到 一 个 Reg。 

为 了 概括 这 样 一 个 序列 ， 我 们 将 使 用 如 上 图 左边 所 示 的 图 。 被 点 线 框 起 来 的 盒子 表示 与 这 棵 树 匹配 
的 特定 右 部 ， 其 中 规则 的 标号 记录 在 每 一 个 盒子 的 左上 角 。 图 的 下 方 的 规则 标号 序列 表示 被 运用 的 规则 
序列 。 重 写 序列 使 用 最 后 规则 的 左 部 蔡 换 被 杠 起 来 的 子 树 。 
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图 11-6 一 个 简单 的 树 重 写 序列 


注意 非 终止 符 是 如 何 保证 操作 树 在 它们 交 选 点 处 的 适当 连结 的 。 规 则 6 把 Lab 重 写成 Reg。 规 则 11 的 
左 叶 是 Reg。 把 这 一 模式 看 成 文法 中 的 规则 把 发 生 于 操作 树 边 界 处 的 所 有 考虑 都 登入 非 终结 符 的 标记 中 。 

对 于 这 个 平凡 子 树 ， 规 则 生成 很 多 重 写 序列 ， 这 反映 了 这 一 文法 的 歧义 性 。 图 11-7 给 出 8 个 这 样 的 
序列 。 在 我 们 的 方案 中 ， 除 了 规则 1 和 规则 7 外 ， 所 有 规则 都 有 代价 1。 因 为 我 们 的 重 写 序列 都 不 使 用 这 
两 个 规则 ， 所 以 它们 的 代价 与 它们 的 序列 长 度 相 等 。 这 些 序列 根据 代价 分 为 三 个 范畴 。 第 一 个 范畴 是 一 
对 序列 <6，11> 和 <8，14>， 每 一 个 都 有 代价 2。 第 二 个 有 四 个 序列 <6，8，10>、<8，6，10>、<6，16， 
9> 和 <8，19，9> ， 每 一 个 都 有 代价 3。 最 后 一 个 是 两 个 序列 <6，8，15，9> 和 <8，6，15，9>， 每 一 个 都 
有 代价 4。 


11 14 ! $10 10 
+ e i: @ + 
i Poot de 
6 AE: 6 8 
Lab; Num: :Lab ‘Num: ;Lab; ‘Num: iLab: Num 
OG: 12i i @6 12 ‘8@6: 212) begs i 12 | 
(6,11) (8,14) (6,8,10) (8,6,10) 

9 A 9 Fg Fg 
+ eo i: 。 9 e 
:16 + | net net 
6 G i 16 NB 6 8 
Lab! Num; ;Lab ‘Num! 'Lab: ‘Num: iLab! ;Num 


a ed See E eS a) 


(6,16,9) (8,19,9) ` (6,B,15,9) (8,6,15,9) 
图 11-7 可 能 的 匹配 


为 了 产生 汇编 代码 ， 筛 选 器 使 用 与 每 一 规则 关联 的 代码 模板 。 一 个 规则 的 代码 模板 是 由 实现 产生 
式 所 生成 的 子 树 的 汇编 代码 操作 序列 组 成 的 。 例 如 ， 规 则 15 把 树 模 式 +(Reg!，Reg,) 映射 到 代码 模板 
add ri, rz=>rnew。 往 选 器 使 用 保存 r, 和 rs 所 对 应 的 子 树 的 结果 的 寄存 器 名 埠 换 r1 和 r2。 它 为 roow 分 配 一 
个 新 的 虚拟 寄存 器 名 。AST 的 一 个 铺盖 描述 代码 生成 器 应 该 使 用 的 规则 。 代 码 生 成 器 使 用 相关 的 模板 
来 在 自 底 向 上 遍历 的 过 程 中 生成 汇编 代码 。 必 要 时 ， 它 提供 名 字 来 把 存储 位 置 结合 到 一 起 并 发 行 对 应 
于 这 一 遍历 的 实例 操作 。 

代码 生成 器 应 该 选择 产生 最 低 代价 汇编 序列 的 铺盖 。 图 11-8 给 出 对 应 于 每 一 个 可 能 铺盖 的 代码 。 所 
有 的 寄存 器 名 字 已 被 适当 地 替换 。<6，11> 和 <8，14> 都 产生 最 低 代 价 2。 它 们 导致 不 同 但 等 价 的 代码 序 
列 。 因 为 它们 有 相同 的 代价 ， 所 以 第 选 器 可 以 在 它们 中 间 随 意 选择 。 如 预见 的 那样 ， 其 他 序列 有 更 高 的 
代价 。 
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load] @6 > 
loadAI ri,12 > rj 


(6,11) 


load] 12 > ñ 

loadl @6 => Try 

10adA0 ri rj > rk 
(8,6,10) 


loadI 12 > Ty 
loadAl ri, @G => ry 


(8,14) 


loadI @G > ñ 

addl mi,12 = rj 

load rj => rk 
(6,16,9) 


1oadI @G > Ñ 

loadl 12 = rj 

ToadA0 ri rj > rk 
(6,8,10) 


loadI 12 => ri 
addI ri, @G > rj 
load rj => Tk 


第 11 Ë 


(8,19,9) 


loadl 12 > ñ 
loadl 66 => r 
add meri = rk add rr = rk 
load rx >n 
(6,8,15,9) 


load! @6 > ñ 
loadl 12 s rj 


load rx > r 
(8,6,15,9) 





图 11-8 上 述 匹配 的 代码 序列 


如 果 1oadAI 只 接受 有 限 范围 内 的 参数 ， 那 么 序列 <8 ，14> 可 能 无 法 工作 ， 因 为 最 终 取代 @6 的 地 址 对 
于 这 一 操作 中 的 立即 域 来 说 可 能 太 大 。 为 了 处 理 这 种 限制 ， 编 译 器 设计 者 可 以 把 适当 受 限 常量 的 概念 引 
人 到 重 写 文法 中 。 这 可 以 采用 一 个 新 的 终止 符 形式 ， 这 一 终止 符 只 表示 给 定 范围 内 的 整数 ， 例 如 ， 对 于 
12 位 的 域 ， 这 可 能 是 0< i<4096。 利 用 这 样 的 区 别 ， 以 及 通过 检查 整数 的 每 一 个 实例 来 对 其 进行 分 类 的 
代码 ， 代 码 生 成 器 可 以 回避 序列 <8，14>， 除 非 @6 落 入 10adAI 的 立即 操作 数 的 允许 范围 内 。 

代价 模型 操控 代码 生成 器 来 筛选 更 好 的 序列 。 例 如 ， 注 意 序列 <6，8，10> 使 用 两 个 1oadI 操 作 ， 且 其 后 
跟随 一 个 1oadA0。 代 码 生成 器 喜欢 代价 较 低 的 序列 ， 每 一 个 这 样 的 序列 都 避 开 一 个 1oadI 操 作 ， 并 发 行 更 少 
的 操作 。 同 样 地 ， 代 价 模型 避 开 使 用 一 个 显 式 加 法 的 四 个 序列 ， 相 反 ， 更 喜欢 执行 寻 址 硬件 中 的 隐 式 加 法 。 


113.2 寻找 铺盖 


为 了 把 这 些 思想 运用 到 代码 生成 中 ， 我 们 需要 能 够 构造 好 铺盖 的 算法 ， 即 构造 一 个 产生 高 效 代码 的 铺 
盖 。 给 定 一 个 规则 集合 ， 这 一 规则 集合 编码 操作 符 树 ， 并 把 它们 与 一 个 AST 的 结构 相关 联 ， 代 码 生成 器 应 
该 为 特定 的 AST 发 现 高 效 铺盖 。 构 造 这 样 的 铺盖 有 若 于 有 效 技术 。 它 们 在 概念 上 相似 ， 但 在 细节 上 不 同 。 

为 了 简化 这 一 算法 ， 我 们 做 两 个 关于 重 写 规则 形式 的 假设 。 第 一 ， 每 一 个 操作 最 多 有 两 个 操作 数 。 
扩展 这 一 算法 来 处 理 一 般 情况 是 直截了当 的 ， 但 是 具体 细节 使 我 们 的 说 明 变 得 复杂 。 第 二 ， 规 则 的 右 部 
最 多 包含 一 个 操作 。 这 简化 匹配 算法 ， 而 又 不 失 一 般 性 。 一 个 简单 、 机 械 式 的 过 程 可 以 把 无 限制 情况 转 
换 成 这 种 更 简单 的 情况 。 对 于 产生 式 a 一 op(B，opz(y,5))， 把 它 重 写成 c 一 opl(68，c) Ma'-op,y, ô)» 
其 中 a' 是 只 在 这 两 个 规则 中 出 现 的 新 符号 。 这 所 引入 的 非 终结 符 和 产生 式 的 数量 是 由 原来 的 文法 中 出 现 
的 操作 符 的 数目 决定 的 。 

为 了 使 这 一 讨论 更 具体 ， 考 虑 规则 11，Reg 一 全 (+(Reg1，Num1))。 转 换 把 它 重 写成 Reg 一 令 
(R11P2) 和 R11P2->+(Regi，Numi)， 其 中 R11P2 是 一 个 新 符号 。 注 意 R11P2 的 新 规则 与 描述 addI 的 规则 16 
相同 。 这 一 转换 在 文法 中 加 入 更 多 的 歧义 性 。 然 而 ， 独 立地 跟踪 和 匹配 这 两 个 规则 使 得 模式 匹配 器 考虑 
每 一 个 规则 的 代价 。 取 代 规则 11 的 规则 应 该 有 与 原来 规则 相同 的 代价 1。( 每 一 个 规则 可 以 有 小 数 代价 ， 
或 者 它们 中 间 的 一 个 有 零 代价 .) 这 反映 出 使 用 规则 16 重 写 产 生 一 个 addI 操 作 ， 而 R11P2 的 规则 却 把 加 法 
登入 一 个 1oadAI 操 作 的 地 址 生成 中 。 当 可 能 时 ， 这 一 新 规则 通过 利用 上 下 文 来 特 化 匹配 。 
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铺盖 的 目标 就 是 对 于 每 一 个 结 点 ， 使 用 编译 器 能 用 于 实现 这 一 结 点 的 模式 集合 来 对 其 赋 标 签 。 因 为 
规则 标号 直接 对 应 于 右 部 的 模式 ， 所 以 代码 生成 器 可 以 使 用 这 些 标号 作为 模式 的 缩写 。 编 译 器 可 以 在 对 
这 棵 树 的 后 序 遍 历 中 为 每 一 个 结 点 计算 规则 标号 序列 ， 即 模式 序列 。 图 11-9 给 出 一 个 算法 Ti7e 的 梗概 ， 
这 一 算法 为 AST 中 以 结 点 0 为 根 的 树 寻找 一 个 铺盖 。 对 于 AST 中 的 每 一 个 结 点 n， 这 一 算法 使 用 Labe7(n) 
为 其 赋 标 签 ， 其 中 Labe7(n) 由 可 以 用 于 铺盖 以 结 点 1 为 根 的 树 的 所 有 规则 标号 组 成 。 它 在 后 序 遍 历 中 计 
算 Labe1 集 合 ， 以 确保 在 为 一 个 结 点 赋 标 签 之 前 先 为 这 个 结 点 的 子 结 点 赋 标 签 。 


Tile(n) 
Label(n) +- @ 
if n is a binary node then 
Tile(left(n)) 
Tile(right(n)) 
for each rule r that matches nS operation 
if left(r) € Label(left(n)) and right(r) € Label(right(n)) 
then Label(n) — Label(n) ù {r} 
else if n is a unary node then 
Tile(left(n)) 
for each rule r that matches n's operation 
if left() € Label(left(n)) 
then Label(n) +- Label(n) u {r} 
else /* n is a leaf */ 
` Label(n) + { all rules that match the operation in n} 





图 11-9 计算 铺盖 AST 的 LabeJ 集 合 


考虑 二 元 结 点 的 内 循环 。 为 了 计算 Labe1(n)， 这 一 内 循环 检查 实现 由 nn 描述 的 操作 的 每 一 个 规则 r。 
它 使 用 函数 Teft 和 7ight 来 遍历 AST 和 树 模式 (或 者 规则 的 右 部 )。9 因为 Tile 已 经 为 n 的 子 结 点 赋 了 标 
签 ， 它 可 以 使 用 简单 的 关系 测试 把 r 的 子 结 点 与 pn 的 子 结 点 对 照 。 如 果 Jeft(r)ELabel( Jeft(n))， 那 么 
Tile 已 经 发 现 了 它 可 以 按 与 使 用 r 实 现 n 相 适合 的 方式 为 n 的 左 子 树 生 成 代码 。 同 样 的 讨论 也 适用 于 r 和 n 
的 右 子 树 。 如 果 两 个 子 树 都 匹配 ， 那 么 r 属 于 LabeJ(m)。 

为 了 加 速 这 一 匹配 过 程 ， 我 们 可 以 预计 算 所 有 可 能 的 匹配 ， 把 它们 存储 在 一 个 表 中 ， 并 使 用 由 结 点 
n 处 的 操作 符 和 它 的 子 结 点 的 标签 集合 ， 为 索引 的 表 引 用 来 替换 二 元 结 点 和 一 元 结 点 的 内 循环 。 这 一 标 
签 集合 是 有 界 的 。 如 果 R 是 规则 数量 ， 那 么 |Labe7(n)|<R， 且 标签 集合 的 数目 不 超过 2*。 幸 运 的 是 , X 
法 的 结构 划 去 很 多 这 样 的 集合 。 如 果 每 一 个 规则 有 一 个 运算 符 和 两 个 子 结 点 ， 那 么 查找 表 可 以 以 这 个 操 
作 符 和 两 个 子 结 点 为 索引 。 这 导致 一 个 大 小 为 | 操作 树 | x | 标签 集合 | 的 表 ， 这 仍旧 很 大 。 对 于 拥有 200 个 
操作 和 带 有 1 000 个 标签 集合 的 文法 的 机 器 ， 结 果 表 有 200 000 000 个 条 目 。 幸 运 的 是 ， 为 这 一 目的 而 构 
造 的 表 是 稀疏 的 ， 而 且 可 以 被 高 效 地 编码 。( 事 实 上 ， 和 寻找 有 效 地 构建 和 编码 这 些 表 的 方法 是 使 得 树 模 
式 匹配 成 为 代码 生成 的 实用 工具 的 一 个 关键 进步 。) 

寻找 低 代价 的 匹配 

图 11-9 中 的 算法 寻找 模式 集合 中 的 所 有 匹配 。 事 实 上 ， 我 们 是 要 代码 生成 器 寻找 最 低 代 价 的 匹配 。 
尽管 它 可 以 从 所 有 匹配 集合 中 得 到 最 低 代价 匹配 ， 但 还 是 存在 更 高 效 的 计算 方法 。 

在 自 底 向 上 遍历 AST 的 过 程 中 ， 代 码 生 成 器 可 以 发 现 每 一 棵 子 树 的 最 低 代价 匹配 。 自 底 向 上 的 顺序 
保证 代码 生成 器 可 以 计算 每 一 个 可 能 匹配 的 代价 ， 即 匹配 的 规则 代价 加 上 相关 的 子 树 匹 配 的 代价 。 原 理 


日 回想 一 下 ， 每 一 个 规则 描述 一 个 操作 符 和 至 多 两 个 子 结 点 。 因 此 ， 对 于 规则 ~”，7eft(r) 和 right(r) 都 有 
明确 的 含义 。 
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上 看 ， 它 可 以 如 图 11-9 所 示 的 那样 发 现 匹配 ， 并 保留 最 低 代 价 匹 配 ， 而 不 是 保留 所 有 的 匹配 。 在 实践 中 ， 
这 一 过 程 会 更 复杂 一 些 。 

代价 函数 本 质 上 取决 于 目标 处 理 器 ; 不 能 从 文法 自动 得 到 它 。 相 反 ， 它 必须 编码 目标 机 器 的 性 质 并 
反映 发 生 在 汇编 语言 的 各 操作 之 间 的 相互 作用 ， 特 别 是 从 一 个 操作 到 另 一 个 操作 的 值 流 的 影响 。 

编译 程序 中 的 一 个 值 可 以 有 若干 种 不 同 的 形式 。 各 形式 之 间 的 差异 构成 指令 筛选 器 的 关键 ， 因 为 这 
些 差异 将 能 够 使 用 这 个 值 的 目标 机 器 操作 集合 。 在 典型 的 机 器 上 ， 一 个 值 可 以 在 寄存 器 中 或 在 内 存 位 置 
中 ,或 者 它 可 能 是 一 个 编译 时 常量 且 足 够 小 而 适用 于 某 些 或 全 部 立即 操作 。 

当 指 令 第 选 器 设法 寻找 特定 子 树 的 匹配 时 ， 它 必须 知道 评估 这 一 子 树 的 每 一 个 操作 数 的 代价 。 如 果 
这 些 操作 数 处 于 不 同 的 存储 分 类 中 ， 如 寄存 器 、 内 存单 元 或 立即 常量 ， 那 么 代码 生成 器 必须 知道 把 这 一 
操作 数 评估 成 各 存储 分 类 的 代价 。 因 此 ， 它 必须 跟踪 生成 每 一 个 存储 分 类 的 最 低 代价 序列 。 当 它 做 自 底 
向 上 遍历 来 计算 代价 时 ， 代 码 生 成 器 可 以 轻松 确定 每 一 个 存储 分 类 的 最 低 代价 匹配 。 这 只 给 这 一 过 程 增 
加 少许 工作 量 ， 但 是 这 一 增加 量 是 由 与 存储 分 类 数量 相等 的 一 个 因数 决定 的 ， 也 就 是 整体 上 依赖 于 目标 
机 器 的 一 个 数 ， 而 且 它 不 依赖 于 重 写 规则 的 数量 。 

精心 的 实现 可 以 在 铺盖 一 棵 树 的 同时 累加 这 些 代 价 。 在 每 一 次 匹配 时 ， 如 果 代 码 生 成 器 保留 最 低 代 
价 匹配 ， 那 么 它 将 产生 一 个 局 部 最 优 的 铺盖 。 即 ， 在 每 一 个 结 点 处 ， 对 于 给 定 的 规则 集合 和 代价 函数 ， 
不 存在 更 好 的 选择 。 自 底 向 上 的 代价 累加 为 寻找 最 小 代价 铺盖 提供 一 个 动态 规划 解决 方案 。 

如 果 我 们 要 求 代价 是 固定 的 ， 那 么 代价 计算 可 以 番 人 模式 匹配 器 的 构建 中 。 这 把 计算 从 编译 时 移 到 
构建 算法 中 ,并 几乎 总 是 产生 更 快 的 代码 生成 器 。 如 果 我 们 允许 代价 发 生变 动 且 需 考虑 匹配 时 的 上 下 文 ， 
那么 代价 比较 必须 在 编译 时 完成 。 这 也 许 会 放 慢 代码 生成 器 的 速度 ， 但 是 它 使 得 代价 函数 有 更 多 的 灵活 
性 ， 而 且 代 价 函 数 可 以 更 精确 地 反映 运行 时 行为 。 


11.3.3 工具 


面向 树 、 自 底 向 上 的 代码 生成 方法 导致 高 效 指令 篇 选 器 。 存 在 若干 种 编译 器 设计 者 实现 基于 这 些 原 
理 的 代码 生成 器 的 方法 。 

1) 我 们 可 以 手工 编写 类 似 于 Ti1e 的 匹配 器 ， 当 这 一 匹配 器 铺盖 树 时 显 式 地 检查 匹配 规则 。 精 心 的 
实现 可 以 限制 对 每 一 个 结 点 必须 检查 的 规则 集合 。 这 可 避免 较 大 的 稀疏 表 并 导致 简洁 的 代码 生成 器 。 

2) 因为 这 一 问题 是 有 限 的 ， 我 们 可 以 把 它 编码 为 一 个 有 穷 自动 机 ， 或 树 匹配 自动 机 ， 并 得 到 一 个 
DFA 的 最 低 代价 行为 。 在 这 一 方案 中 ， 查 找 表 编码 这 一 有 穷 自 动机 的 转换 函数 ， 隐 式 地 协同 所 有 所 需 的 
状态 信息 。 已 有 若干 使 用 这 一 方法 构建 的 系统 ， 这 些 系统 通常 被 称 为 自 底 向 上 重 写 系统 (BURS)。 

3) 规则 的 文法 形式 表明 可 以 使 用 分 析 技术 。 必 须 扩 展 分 析 算法 来 处 理 来 自 于 机 器 描述 的 高 度 歧义 
性 的 文法 并 选择 最 小 成 本 分 析 。 

4) 通过 把 树 线性 化 成 一 个 前 绥 串 ， 这 一 问题 可 以 转换 成 一 个 串 匹 配 问题 。 然后， 编译 器 可 以 使 用 
串 模式 匹配 算法 寻找 可 能 的 匹配 。 

存在 实现 后 三 种 方法 的 可 用 工具 。 编译 器 设计 者 生成 目标 机 器 指令 集合 的 描述 ， 而 代码 生成 器 生成 
器 从 这 一 描述 创建 可 执行 代码 。 

已 自动 化 的 工具 在 细节 上 是 不 同 的 。 每 一 个 被 发 行 指令 的 代价 随 着 技术 的 不 同 而 不 同 。 某 些 工 具 较 
快 ， 某 些 工具 较 慢 ; 但 没有 哪个 工具 足够 慢 使 得 它 对 结果 编译 器 的 速度 产生 重要 的 影响 。 这 些 方法 允许 
不 同 的 代价 模型 。 某 些 系 统 限 制 编译 器 设计 者 对 于 每 一 个 规则 给 予 固定 的 代价 ; 因此 ， 它 们 可 以 在 表 生 
成 期 间 执行 某 些 或 全 部 动态 规划 。 而 另外 一 些 系统 允许 更 一 般 的 在 匹配 过 程 中 可 变 的 代价 模型 ; 这 些 系 
统 在 代码 生成 期 间 必 须 执 行动 态 程序 设计 。 然 而 ， 所 有 这 些 方法 一 般 产生 既 有 效 又 高 效率 的 代码 生成 器 。 
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11.4 ETMESI 


EO Wie Boob BY B — PF DE CR EER AR EA Ja PY BREE TF BR A EAL ( peephole 
optimization) KJER. 2 Ti AHA ROS Ate, GX ER ARIR EN SOR SHB IR 
与 目标 机 器 的 操作 匹配 的 简单 方案 结合 起 来 。 本 节 介 绍 窥 孔 优化 ， 揭 示 其 作为 指令 筛选 的 机 人 制 的 使 用 ， 
并 描述 已 开发 的 用 于 自动 化 窥 孔 优化 器 结构 的 技术 。 


11.4.1 询 孔 优化 


罕 孔 优化 背后 的 基本 思想 很 简单 : 编译 器 可 以 通过 检查 邻近 操作 的 短 序 列 高 效 地 发 现 局 部 改进 。 罕 
孔 优化 器 最 初 是 为 了 在 编译 的 所 有 其 他 步骤 完成 之 后 运行 而 被 提出 的 。 它 既 消 耗 又 生成 汇编 代码 。 这 一 
优化 器 有 一 个 滑动 窗口 ， 即 “ 窥 孔 ”， 它 可 以 在 代码 中 移动 。 在 每 一 步 ， 窥 孔 优 化 器 检查 窗口 内 的 操作 ， 
寻找 它 可 以 改进 的 特定 模式 。 当 它 识别 出 一 个 模式 时 ， 它 使 用 更 好 的 指令 序列 重 写 这 一 模式 。 一 个 有 限 
模式 集合 与 一 个 关注 的 限定 区 域 的 结合 导致 快速 的 处 理 。 

一 个 典型 的 模式 示例 是 在 存储 之 后 跟随 同一 位 置 的 装 入 。 这 个 装 入 可 以 用 一 个 找 贝 来 替换 。 


storeAl r; => Tarps8 = storeAl ri = rarp,8 
loadAl rarp,8 => ris i2i ml > ris 


如 果 窥 孔 优化 器 识别 出 这 一 重 写 使 得 存储 操作 死亡 〈 也 就 是 说 ，1oad 只 是 为 了 存储 于 内 存 中 的 这 个 
值 而 使 用 的 ) ， 那 么 它 还 可 能 消除 这 一 存储 操作 。 然 而 ， 识 别 死 亡 存储 一 般 需 要 超出 窥 孔 优化 器 的 作用 
域 范 围 的 全 局 分 析 。 罕 孔 优化 可 以 改进 的 其 他 模式 包括 简单 的 代数 等 式 ， 例 如 ， 


addI rz,0 > r 
=> mult rayrz => rio 
mult ra,ry => rio 


以 及 目标 本 身 是 一 个 分 支 的 分 支 


jumpI 一 110 => jumpI 一 Ti 
Tyo: jump! + 11 Tio: jumpI > 14; 


如 果 这 消除 最 后 到 1 的 分 支 ， 那 么 开始 于 li 的 基本 模块 变 成 不 可 达 且 被 消除 。 遗 憾 的 是 ， 对 在 1 处 的 
操作 不 可 达 的 证 明 所 花费 的 分 析 比 帘 孔 优化 期 间 的 一 般 可 行 的 分 析 要 多 《参见 10.3.1 节 )。 

早期 的 罕 孔 优化 器 使 用 一 个 手工 编码 的 模式 的 有 穷 集 合 。 它 们 使 用 穷 举 搜索 来 匹配 这 一 模式 ， 但 却 
可 以 快速 运行 ， 因 为 模式 数量 较 小 且 有 较 小 的 窗口 ， 一 般 地 窗口 中 只 有 两 到 三 个 操作 。 


四 元 组 上 的 树 模式 匹配 

用 于 描述 这 些 技术 的 术语 ， 如 树 模式 匹配 和 写 孔 优化 ， 隐 含 着 可 以 用 于 这 些 技术 的 IR 种 类 的 假 | 
| 设 , BURS 理 论 研究 树 上 的 重 写 操作 。 这 带 来 这 样 的 一 种 印象 ,基于 BURS 的 代码 生成 器 需要 树 形 IR。 | 
| 同样 地 ， 帘 孔 优化 器 最 初 是 作为 最 后 的 汇编 到 汇编 改进 遍 而 提出 的 。 移 动 指令 窗口 的 思想 暗示 基于 


罕 孔 的 代码 生成 器 需要 线性 、 低 级 的 了 及。 

两 个 技术 都 适用 于 大 多 数 IR。 编 译 器 可 以 把 ILOC 等 的 低级 线性 及 解释 为 树 。 每 一 个 操作 变 成 | 
一 个 树 结 点 ; 操作 数 的 复 用 表示 边 。 同 样 地 ， 如 果 编 译 器 为 每 一 个 结 点 赋 一 个 名 字 ， 那 么 它 能 够 通 | 
过 执行 后 序 遍 历 把 树 解释 成 为 线性 形式 。 聪 明 的 实现 器 可 以 把 在 本 章 所 给 出 的 方法 用 于 现实 各 种 IR | 
形式 。 
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窥 孔 优化 的 进步 已 超出 了 匹配 少数 几 种 模式 。 复 杂 ISA 的 增加 导致 更 系统 化 的 方法 。 现 代 窥 孔 优化 
器 把 这 一 过 程 分 解 成 三 个 不 同 的 任务 : 扩展 、 简 化 和 匹配 。 它 系统 地 运用 符号 解释 和 简化 来 取代 早 前 系 
统 的 模式 驱动 优化 。 






IR 


上 图 从 结构 上 看 起 来 像 是 一 个 编译 器 。 扩 展 器 识别 IR 形 式 的 输入 代码 ， 并 构建 一 个 内 部 表示 。 简 化 器 在 
那个 IR 上 执行 某 些 重 写 操作 。 匹 配器 把 这 一 IR 转 换 成 目标 机 器 代码 ,一般 是 汇编 代码 (ASM)。 如 果 输 
入 和 输出 语言 相同 ， 那 么 这 一 系统 是 一 个 窥 孔 优化 器 。 输 入 和 输出 代码 使 用 不 同 的 语言 时 ， 相 同 的 算法 
可 以 执行 指令 筛选 ， 如 我 们 将 在 11.4.2 节 看 到 的 那样 。 

扩展 器 逐个 操作 地 把 汇编 代码 重 写成 表示 一 个 操作 的 所 有 直接 效应 的 低级 下 操 作 (LLIR) 的 序列 ， 
这 些 效 应 至 少 包括 影响 程序 行为 的 所 有 效应 。 如 果 操 作 add _ ri，ri 一 mk 设置 条 件 代 码 ， 那 么 它 的 LLIR 表 
示 必 须 包含 把 ri+rj 赋 值 给 mr 的 操作 以 及 把 条 件 代码 设置 为 适当 值 的 操作 。 扩 展 器 一 般 具 有 简单 结构 。 无 
需 考 虑 上 下 文 就 可 以 逐一 扩展 操作 。 这 一 过 程 为 每 一 个 ASM 操 作 使 用 一 个 模板 ， 并 适当 替换 这 一 模板 内 
的 寄存 器 名 字 、 常 量 和 标签 。 

简化 器 在 整个 LLIR 上 做 一 遍 处 理 ， 检 查 LLIR 上 的 一 个 小 窗口 内 的 操作 ， 并 设法 系统 地 改进 它们 。 
简化 的 基本 机 制 是 前 向 替换 、 代 数 化 简 (例如 ，x+0=*)、 评 估 常 量 值 表 达 式 〈 例 如 ，2+17 一 19) 以 及 
消除 诸如 无 用 条 件 代码 生成 等 无 用 效果 。 因 此 ,简化 器 在 这 一 窗口 内 对 LLIR 执 行 有 限 局 部 优化 。 这 必须 
使 在 LLIR 中 揭示 出 的 所 有 细节 (地址 算术 、 分 支 目 标 等 等 ) 服从 于 局 部 优化 的 标准 。 

在 最 后 一 步 ， 匹 配器 参照 模式 库 比较 简化 了 的 LLIR ， 寻 找 能 够 最 好 地 刻画 这 一 LLIR 内 的 所 有 效应 
的 模式 。 最 终 的 代码 序列 可 能 产生 超出 LLIR 序 列 所 要 求 的 效应 ; 例如 ， 它 可 能 创建 新 的 、 尽 管 也 许 无 用 
的 条 件 代码 值 。 然 而 ， 它 必须 保持 正确 性 所 需要 的 效应 。 它 不 能 消除 一 个 活着 的 值 ， 无 论 这 个 值 是 被 存 
储 于 内 存 中 、 寄 存 器 中 还 是 诸如 条 件 代 码 等 隐 式 设置 的 位 置 中 。 

图 11-10 给 出 这 一 方法 是 如 何在 11.2 节 的 例子 上 工作 的 。 在 左上 方 ， 它 开始 于 如 图 11-4 所 示 的 低级 
AST 的 四 元 组 。( 回想 一 下 ， 这 一 AST 计 算 w<x-2 x y， 其 中 w 被 存储 在 局 部 AR 中 偏 移 为 4 的 地 方 ，x 作 为 
一 个 引用 参数 被 存储 ， 这 一 参数 的 指针 存储 于 距 ARP 偏 移 为 - 16 的 地 方 ，y 则 存储 于 距 标签 @6 偏 移 为 12 
的 地 方 。) 扩展 器 创建 如 图 中 右上 方 所 示 的 LLIR。 简 化 器 化 简 这 一 代码 ， 生 成 图 中 右 下 方 的 LLIR 代 码 。 
根据 这 一 LLIR 片 段 ， 匹 配器 构造 出 左下 方 的 ILOC 代 码 。 

理解 这 一 过 程 的 关键 在 于 简化 器 。 图 11-11 给 出 窥 孔 优化 器 在 处 理 本 例 中 的 低级 及 时 的 窗口 内 的 相 
继 序列 。 假 设 这 一 罕 孔 优化 器 有 三 操作 窗口 。 序 列 1 显示 带 有 前 三 个 操作 的 窗口 。 没 有 化 简 的 可 能 。 优 
化 器 把 定义 ro 的 第 一 个 操作 移出 这 一 窗口 ， 并 带 进 rmi 的 定义 。 在 这 一 窗口 中 ， 它 向 前 把 mz 蔡 换 成 rm 的 
定义 。 因 为 这 使 Pr 死亡， 优化 器 忽视 riz 的 定义 ， 并 把 另外 一 个 操作 加 入 这 一 窗口 的 底部 ， 达 到 序列 3。 
接 下 来 ， 它 把 ris 合 入 定义 ru 的 内 存 引 用 中 ， 产 生 序 列 4。 

序列 4 没有 化 简 的 可 能 ， 所 以 优化 器 把 rn 的 定义 移出 这 一 窗口 。 优 化 器 不 能 化 简 序列 5， 所 以 它 也 把 
ri 的 定义 移出 这 一 窗口 。 它 能 够 通过 向 前 将 -16 替换 成 定义 ri; 的 加 法 来 化 简 序 列 6。 这 一 动作 产生 序列 
7。 优 化 器 继续 这 一 行为 ， 在 可 能 时 化 简 代码 ， 当 它 不 能 化 简 代 码 时 就 前 进 。 当 达到 序列 13 时 ， 它 停止 ， 
因为 它 不 能 进一步 化 简 这 一 序列 ， 而 且 它 没有 额外 的 代码 可 以 带 到 这 一 窗口 中 。 

回 到 图 11-10， 比 较 化 简 后 的 代码 和 源 代码 。 化 简 后 的 代码 是 由 离开 这 一 窗口 的 顶部 的 那些 操作 ， 
再 加 上 当 化 简 停 止 时 留 在 这 一 窗口 内 的 那些 操作 组 成 的 。 化 简 后 ， 计 算 需 要 8 个 操作 ， 而 不 是 14 个 操作 。 
它 使 用 7 个 寄存 器 (rss 除外 )， 而 不 是 3 个 寄存 器 。 
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操作 符 ”Arg! Arg, 
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loadI 2 => 
loadI 6 > 
loadAl misl2 > 
mult rloyrl4 > 
ToadAI  rarp,-16 =. 
load Tig > 
sub Tigri > 
storeAl rao => 
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图 11-10 对 例子 的 扩 晨 、 化 简 和 匹配 
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Tiz + 12 
ri3 Ni + riz 





序列 1 









Ti eG 
Tig + M(ru + 12) 
ris <— rio X Tia 


序列 4 


Tis 4- Tig X Tig 
17 + Tarp + -16 
ris + M(ri7) 


序列 2 
Tig M(ri + 12) 


fis — rio X Tig 





Tig + -16 
序列 5 
T15 Tio X Tig 
Trie + M(rarp + -16) 
Tig — Mrl8) 





序列 7 
Tig — M(rye) 
Yeo & Tig — Tis 


序列 8 
r20 <— Nig ~ Tis 
To e 4 


rie @G 


Ti e r+ 12 
Tia + M(ri3) 


序列 3 


Tis — rio X ria 





Tige e -16 





riz 全 Tarp + 16 
序列 6 
Tig — M{rarp + -16) 


rig ~ M(rie) 







T20 + T19—T15 
序列 9 

T20 ri9~Ts 

T22 ~ Tarp + 4 





Tai 4 


序列 10 


T22 +— Tarp + 21 


序列 11 


Yeo — Tig 一 六 15 


M(rarp+ 4) — ro 





序列 13 
图 11-11 化 简 器 产生 的 序列 


M(rzz) 全 rzo 


序列 12 
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若干 设计 问题 影响 窥 孔 优化 器 改进 代码 的 能 力 。 检 查 一 个 值 的 死亡 时 间 的 能 力 在 化 简 中 起 着 重要 的 
作用 。 控 制 流 操作 的 处 理 决 定 在 模块 边界 将 发 生 的 事情 。 罕 和 孔 窗 口 的 大 小 限制 优化 器 组 合 相 关 操 作 的 能 
力 。 例 如 ， 更 大 的 窗口 将 使 得 简化 器 把 常量 2 倒 人 乘法 操作 中 。 下 面 3 个 小 节 探讨 这 些 问 题 。 

1. 死亡 值 

识别 出 表示 为 死亡 值 的 无 用 效果 的 能 力 是 这 一 过 程 的 关键 。 回 想 一 下 ， 在 代码 的 某 个 点 p 一 个 值 是 
死亡 的 ， 如 果 不 存在 从 p 到 这 个 值 的 任意 使 用 的 路 径 。 遗 憾 的 是 ， 确 定 一 个 值 的 死亡 一 般 需 要 对 创建 这 
个 值 的 整个 作用 域 的 分 析 。 那 么 ， 简 化 器 是 如 何 知道 当 它 关注 代码 的 一 个 小 窗口 时 某 些 值 是 死亡 的 呢 ? 

在 扩展 过 程 期 间 ， 优 化 器 可 以 为 每 一 个 操作 构造 死亡 变量 表 。 下 面 两 个 观察 可 以 实现 这 一 点 。 第 一 ， 
扩展 器 可 以 向 后 遍历 代码 来 完成 它 的 工作 。 当 它 人 遍历 每 一 个 块 时 ， 在 处 理 前 驱 之 前 处 理 CFG 的 后 继 (4 
然 ， 是 自 后 继 之 外 的 后 继 ) ， 它 可 以 建立 一 个 死亡 变量 表 。 第 二 ， 大 部 分 重要 的 死亡 值 是 纯 局 部 值 ， 即 
在 单一 模块 内 定义 并 使 用 它们 。 这 些 值 可 以 作为 代码 形态 的 内 容 来 识别 ， 编 译 器 可 以 为 这 些 值 使 用 一 个 
独立 的 名 字 或 寄存 器 编号 区 域 ， 或 者 优化 器 可 以 放置 它 能 够 发 现 的 这 些 值 。 

需要 被 跟踪 的 频繁 死亡 的 值 的 典型 例子 是 条 件 代 码 。 与 ILOC 的 虚拟 机 器 形成 对 比 ， 在 实际 机 器 的 
描述 中 ,会 出 现 诸如 条 件 代 码 这 样 的 详细 情况 。 某 些 计 算 机 使 用 算术 操作 来 设置 条 件 代码 ; 如 果 一 个 模 
块 结束 于 对 计算 的 值 是 否 等 于 零 的 测试 ， 那 么 可 以 通过 使 用 前 面 计算 的 条 件 代码 来 避 开 这 一 比较 。 很 自 
然 ， 扩展 器 必须 包含 这 些 条 件 代码 的 效应 ;。 然 而， 除非 死亡 代码 可 以 被 检查 并 消除 ， 否 则 这 些 不 相关 的 
条 件 代 码 赋值 可 能 妨碍 罕 孔 优化 器 组 合 那些 它 本 能 够 组 合 的 操作 。 

例如 ， 考 虑 计算 r, x rifrk， 如 果 x 和 + 都 设置 条 件 代码 ， 那 么 这 一 两 操作 序列 可 能 生成 如 下 的 LLIR。 

Tu 人 m XK nj 

ce + fx(rx，rg) 

rtz — Ter + Me 

cc + fs (re, rk) 
因为 加 法 跟 在 乘法 的 后 面 ， 所 以 存储 于 条 件 代 码 内 的 第 一 个 值 是 死 的 。 

如 果 简 化 器 消除 为 乘法 cc<—f,(r1, Tr;) 设置 条 件 代 码 的 操作 ， 那 么 它 可 以 把 余下 的 三 个 操作 组 合成 
一 个 乘 -加 操作 ， 假 设 目 标 机 器 有 这 样 的 指令 。 然 而 ， 如 果 它 不 能 消除 cc 一 f(m ，r)， 这 将 妨碍 匹配 器 
使 用 乘 - 加 操作 。 

2. 控制 流 操 作 

控制 流 操作 的 存在 使 简化 器 变 得 复杂 。 处 理 这 些 控制 流 操 作 的 最 容易 方法 是 当 简化 器 达到 分 支 、 跳 
转 或 带 标签 指令 时 清除 它 的 窗口 。 这 防止 简化 器 把 效应 移 到 效应 不 曾 存 在 的 路 径 上 。 

简化 器 可 以 通过 检查 分 支 周围 的 上 下 文 达到 更 好 的 结果 , 但 是 它 将 给 这 一 过 程 带 来 若干 特殊 的 情况 。 
如 果 输 入 语言 编码 带 有 单一 是 标 和 落下 路 径 的 分 支 ， 那 么 简化 器 应 该 跟踪 并 消除 死亡 的 标签 。 如 果 它 消 
除 一 个 标签 的 最 后 使 用 而 且 前 面 的 块 有 一 个 落下 出 口 ， 那 么 它 可 以 消除 这 个 标签 ,组合 这 些 块 ， 并 跨越 
老 边界 进行 化 简 。 如 果 输 入 语言 编码 带 有 两 个 目标 的 分 支 ， 或 者 前 面 的 块 结束 于 一 个 跳 转 ， 那 么 一 个 死 
亡 标签 意味 着 可 以 被 完全 消除 的 一 个 不 可 达 块 。 无 论 哪 种 情况 ， 简 化 器 都 应 该 跟踪 每 一 个 标签 的 使 用 数 
量 ， 并 消除 不 再 被 引用 的 标签 。( 扩 展 器 可 以 计数 标签 的 引用 ， 以 允许 简化 器 使 用 简单 的 引用 计数 方案 
来 跟踪 余下 的 引用 数量 。) 

一 个 更 具 吸 引力 的 方法 可 能 考虑 一 个 在 一 个 分 支 的 两 端的 操作 。 某 些 化 简 有 可 能 跨越 这 一 分 支 ， 把 
这 一 分 支 的 前 一 个 操作 的 效应 与 这 一 分 支 目 标 处 的 那些 操作 的 效应 组 合 起 来 。 然 而 ， 简 化 器 必须 考虑 达 
到 这 个 带 标 签 操 作 的 所 有 路 径 。 
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谓词 操作 需要 某 些 相同 的 考虑 。 在 运行 时 ， 谓 词 值 决 定 哪 些 操作 真 的 执行 。 事 实 上 ， 谓 词 指定 一 条 
经 过 一 个 简单 CFG 的 路 径 ， 尽 管 这 条 路 径 可 能 是 一 条 没有 显 式 标签 或 分 支 的 路 径 。 简 化 器 必须 识别 出 这 
些 效应 并 以 处 理 带 标签 操作 时 使 用 的 方式 来 处 理 它们 。 

3. 物理 窗口 和 逻辑 窗口 

迄今 为 止 ， 我 们 的 讨论 都 集中 在 包含 低级 IR 中 邻近 操作 的 窗口 。 这 一 概念 有 很 好 的 物理 直观 性 ， 而 
且 使 这 一 概念 具体 化 。 然 而 ， 低 级 豚 中 的 邻近 操作 可 能 不 是 操作 于 相同 值 上 。 事 实 上 ， 随 着 目标 机 器 提 
供 更 多 指令 级 并 行 ， 编 译 器 的 前 端 和 优化 器 必须 生成 具有 更 多 独立 和 交替 计算 的 信 程 序 ， 以 保持 目标 机 
器 的 功能 单元 忙碌 。 在 这 种 情况 下 ， 窥 孔 优 化 器 几乎 不 可 能 发 现 改进 代码 的 机 会 。 

为 了 改进 这 一 状况 ， 窥 孔 优化 器 可 以 使 用 逻辑 窗口 ， 而 不 是 物理 窗口 。 使 用 多 辑 窗口 ， 优 化 器 考虑 
被 这 一 代码 内 的 值 流连 结 起 来 的 操作 ， 也 就 是 说 ， 它 一 并 考虑 定义 和 使 用 相同 值 的 操作 。 这 创建 组 合 及 
化 简 相 关 操作 的 机 会 ， 即 使 在 这 些 操作 之 间 存 在 其 他 的 操作 。 

在 扩展 期 间 ， 优 化 器 可 以 把 每 一 个 定义 与 在 相同 模块 中 这 一 定义 的 值 的 下 一 次 使 用 链接 起 来 。 这 使 
得 简化 器 快速 地 把 罗 辑 对 放 在 一 起 。 当 优化 器 遇 到 操作 寺 ， 它 设法 在 考虑 ;的 逻辑 后 继 的 前 提 下 化 简 这 
一 操作 ，; 的 逻辑 后 继 是 块 中 下 一 次 使 用 由 ;定义 的 值 的 操作 。( 因为 化 简 在 很 大 程度 上 依赖 于 向 前 替换 ， 
所 以 很 少 有 理由 考虑 下 一 个 物理 操作 ， 除 非 它 使 用 ;的 结果 .。 ) 在 一 个 块 内 使 用 逻辑 窗口 可 以 使 简化 器 更 
有 效 ， 同 时 减少 所 需 的 编译 时 间 和 化 简 后 所 余下 的 操作 数量 。 在 我 们 的 例子 中 ， 逻 辑 窗口 将 使 简化 器 把 
常量 2 又 人 乘法 中 。 

把 这 一 想法 扩展 到 更 大 的 作用 域 会 增加 一 些 复杂 性 。 编 译 器 可 以 设法 化 简 逻 辑 上 邻近 但 又 相距 太 远 
以 致 难以 一 同 放 入 罕 孔 窗口 内 的 操作 : 或 者 在 同一 个 块 内 或 者 在 不 同 的 块 内 。 这 需要 一 个 全 局 分 析 来 确 
定 每 一 个 定义 可 以 达到 的 使 用 (也 就 是 说 ， 根 据 9.2.4 节 的 可 达 定 义 )。 另 外 ， 简 化 器 必须 识别 单一 定义 
可 能 达到 多 个 使 用 ,而 且 单 一 使 用 可 能 引用 由 几 个 不 同 的 定义 计算 而 得 的 值 。 因 此 ， 简 化 器 不 能 简单 地 
把 定义 操作 与 一 个 使 用 组 合 起 来 ， 并 留 下 余下 的 操作 不 管 。 它 必须 或 者 只 考虑 简单 的 情况 ， 例 如 ， 单 一 
定义 和 单一 使 用 ， 或 者 带 有 单一 定义 的 多 次 使 用 ， 或 者 它 必须 执行 某 些 仔细 的 分 析 以 确定 一 个 组 合 是 否 
是 既 安 全 又 有 效益 。 这 些 复杂 性 表明 在 局 部 或 超 局 部 上 下 文中 运用 逻辑 窗口 。 把 逻辑 窗口 移 到 超出 一 个 
基本 块 的 范围 给 简化 器 带 来 错综复杂 的 情况 。 


11.4.2 MILERE 
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集合 的 需求 。 因 为 三 步 过 程 把 所 有 操作 翻译 成 LLIR 并 设法 化 简 所 有 LLIR 序 列 ， 匹 配器 需要 有 把 任意 
LLIR 序 列 翻 译 回 目标 机 器 的 汇编 代码 的 能 力 。 因 此 ， 这 些 现代 罕 孔 系统 比 早 前 系统 有 更 火 的 模式 库 。 随 
着 计算 机 从 16 位 指令 转移 到 32 位 指令 ， 不 同 汇编 操作 数量 的 爆 增 使 得 手工 生成 模式 成 为 问题 。 为 了 处 理 
这 种 爆 增 ， 大 多 数 现代 罕 孔 系统 包含 从 目标 机 器 的 指令 集合 的 描述 自动 生成 匹配 器 的 工具 。 

生成 描述 处 理 器 指令 集合 所 需 的 巨大 模式 库 工 具 的 出 现 ， 已 使 得 罕 孔 优化 成 为 指令 筛选 的 一 个 具有 
竞争 力 的 技术 。 一 个 最 终 的 转变 进一步 化 简 这 一 情景 。 如 果 前 端 直接 生成 用 于 罕 孔 优化 器 的 LLR， 那 么 
编译 器 不 再 需要 扩展 器 。 同 样 地 ， 化 简 器 也 无 需 处 理 无 用 效应 。 像 设置 一 个 无 关 的 条 件 代码 这 样 的 效应 
的 出 现 是 因为 扩展 器 缺少 足够 多 的 上 下 文 来 确定 它们 是 否 有 用 。 这 带 来 对 扩展 器 计算 死亡 值 列表 的 需求 
以 及 对 简化 器 对 它们 进行 计数 的 需求 。 如 果 前 端 直接 生成 LLIR ， 那 么 它 也 能 生成 它 需 要 的 效应 并 消除 那 
些 它 不 需要 的 效应 。 

这 一 方案 还 将 简化 把 编译 器 的 目标 重 设 到 另 一 个 处 理 器 时 所 需 的 工作 。 为 了 改变 处 理 器 ， 编 译 器 设 
计 者 必须 @ 为 模式 生成 器 提供 适当 的 机 器 描述 ， 使 得 它 能 生成 新 的 指令 筛选 器 ，@ 改变 由 早 前 阶段 生 
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成 的 LLIR 序 列 ， 使 得 这 些 序列 适合 新 的 ISA，@ 修改 指令 调度 器 和 寄存 器 分 配器 ， 以 便 反映 新 ISA 的 特 
性 。 尽 管 这 包含 大 量 的 工作 ， 但 是 描述 、 处 理 和 改进 LLIR 序 列 的 基础 结构 仍 保持 不 变 。 另 外 ， 从 根本 上 
不 同 的 机 器 的 LLIR 序 列 必须 刻画 它们 之 间 的 差异 ; 然而 ， 编 写 这 些 序列 的 基础 语言 仍 保持 相同 。 这 允许 
编译 器 设计 者 构建 跨 体 系 结构 的 一 组 工具 ， 并 且 克 许 编译 设计 者 通过 为 目标 ISA 生 成 适当 低级 IR 并 为 罕 
孔 优 器 提供 一 组 适当 的 模式 来 产生 机 器 特定 的 编译 器 。 

这 一 方案 的 其 他 优势 在 于 简化 器 。 这 一 被 拆 分 的 窥 孔 转换 器 仍然 包含 简化 器 。 代 码 的 系统 化 简 ， 即 
使 是 在 限定 的 窗口 内 执行 ， 也 将 比 使 用 简单 的 手工 编码 遍历 IR 并 将 琢 重 写成 汇编 语言 提供 更 有 意义 的 优 
势 。 向 前 替换 、 简 单 算术 等 式 的 运用 以 及 常量 叙 入 可 以 产生 更 短 、 更 高 效 的 LLIR 序 列 。 而 这 些 又 将 导致 
更 好 的 目标 机 器 代码 。 









RISC、CISC 以 及 指令 筛选 

RISC 体 系 结构 的 早期 支持 者 认为 RISC 将 导致 更 简单 的 编译 器 。 像 BM 801 这 样 的 早期 RISC 机 
器 拥有 的 寻 址 模式 比 同 时 代 的 CISC 机 器 (如 DEC 的 VAX-11) 少 得 多 。 它 们 以 寄存 器 到 寄存 器 操作 
为 特色 ， 并 具有 把 数据 在 寄存 器 和 内 存 之 间 移 动 的 装 入 和 存储 操作 。 与 此 相对 照 ，VAX-11 既 提供 寄 
存 器 操作 数 ， 又 提供 内 存 操作 数 ; 许多 操作 既 支持 二 地 址 形式 ， 又 支持 三 地 址 形式 。 

RISC 机 器 简化 了 指令 筛选 。 它 们 为 实现 给 定 操作 提供 更 少 的 方式 。 它 们 对 寄存 器 的 使 用 的 限制 
更 少 。 然 而 ， 它 们 的 装 入 -存储 结构 增加 寄存 器 分 配 的 重要 性 。 

与 此 相对 照 ，CISC 机 器 拥有 把 更 多 复杂 功能 封装 到 单一 操作 的 操作 。 为 了 有 效 利用 这 些 操作 ， 
指令 筛选 器 必须 在 更 大 的 代码 片段 中 识别 更 大 的 模式 。 这 增加 系统 化 指令 筛选 的 重要 性 ; 本 章 所 述 | 
的 自动 技术 对 CISC 机 器 来 说 更 为 重要 ， 但 是 它们 也 同样 可 以 运用 于 RISC 机 器 。 












若干 重要 的 编译 器 系统 已 经 在 使 用 这 一 方法 。 最 著名 的 编译 器 可 能 是 Gnu 编 译 器 系统 GCC。 它 的 前 
端 生成 称 为 寄存 器 转移 语言 (register-transfer language, RTL) 的 低级 IR。 优 化 遍 处 理 RTL 来 产生 改良 
的 RIL。 后 端 消耗 RTL 并 使 用 罕 孔 方案 产生 各 个 不 同 目标 计算 机 的 汇编 代码 。 简 化 器 是 使 用 系统 的 符号 
解释 来 实现 的 。 罕 孔 优化 器 的 匹配 步骤 实际 上 把 RTL 代 码 解释 成 为 树 ， 它 使 用 从 目标 机 器 的 描述 而 构建 
起 来 的 简单 树 模式 匹配 器 。 诸 如 Davidson 的 VPO 等 其 他 系统 把 机 器 描述 转换 成 文法 ， 并 生成 以 线性 形式 
处 理 RTL 的 小 型 分 析 器 来 执行 匹配 步骤 。 


11.5 高 级 话题 


基于 BURS 和 基于 帘 孔 的 指令 筛选 器 都 是 为 编译 时 效率 而 设计 的 。 然 而 ， 这 两 个 技术 都 受到 编译 器 
设计 者 提供 的 模式 中 所 包含 的 信息 的 限制 。 为 了 找到 最 好 的 指令 序列 ， 编 译 器 设计 者 可 以 考虑 使 用 搜索 。 
这 一 想法 很 简单 。 有 时 候 指令 组 合 可 以 产生 令 人 惊讶 的 效应 。 因 为 其 结果 是 不 可 预料 的 ， 所 以 编译 器 设 
计 者 很 少 预测 它们 ， 因 此 也 不 把 它们 加 入 为 目标 机 器 所 生成 的 描述 中 。 

在 文献 中 ， 有 两 个 把 穷 举 搜索 用 于 改进 指令 筛选 的 不 同方 法 。 第 一 个 方法 设计 基于 罕 孔 的 系统 ， 这 
一 方法 在 编译 代码 时 发 现 并 优化 新 模式 。 第 二 个 方法 涉及 可 能 指令 空间 的 蛮 力 搜索 。 


11.5.1 学 习 疯 孔 模式 


在 实现 或 使 用 窥 孔 优化 器 中 所 引发 的 一 个 重要 问题 是 ， 描 述 目 标 机 器 指令 集合 所 花费 的 时 间 与 结果 
优化 器 或 指令 篇 选 器 的 质量 和 速度 之 间 的 权衡 问题 。 使 用 完备 的 模式 集合 ， 化 简 和 匹配 的 成 本 可 以 通过 
使 用 高 效 的 模式 匹配 技术 而 维持 到 最 小 。 当 然 ， 必 须 有 人 来 生成 所 有 这 些 模式 。 另 一 方面 ， 在 化 简 和 匹 
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配 期 间 解释 规则 的 系统 对 每 一 个 LLIR 操 作 都 有 更 大 的 负荷 。 这 样 的 系统 可 以 使 用 较 小 的 规则 集合 来 进行 
操作 。 这 使 得 系统 易于 构建 。 然 而 ， 结 果 简 化 器 和 匹配 器 运行 得 更 慢 。 

生成 快速 模式 匹配 宽 孔 优化 器 所 需 的 显示 模式 表 的 一 个 高 效 方法 是 ， 把 这 一 优化 器 与 一 个 拥有 符号 
简化 器 的 优化 器 配对 。 在 这 一 方案 中 ， 符 号 简化 器 记录 它 化 简 的 所 有 模式 。 它 每 次 化 简 一 对 操作 时 ， 便 。 [580 
记录 初始 对 和 化 简 了 的 对 。9 然 后 ， 它 可 以 把 结果 模式 记录 在 查找 表 中 来 生成 快速 模式 匹配 优化 器 。 

通过 在 一 个 应 用 的 训练 集 上 运行 符号 简化 器 ， 优 化 器 能 够 发 现 它 所 需 的 大 部 分 模式 。 然 后 ， 编 译 器 
可 以 使 用 这 个 表 作 为 快速 模式 匹配 优化 器 的 基础 。 这 使 得 编译 器 设计 者 在 设计 期 间 消 耗 计算 机 时 间 来 加 
速 编译 器 的 常规 使 用 。 它 极 大 地 降低 必须 描述 的 模式 的 复杂 性 。 

两 个 优化 器 之 间 的 相互 影响 的 增加 可 以 进一步 改进 代码 质量 。 在 编译 时 ， 快 速 模式 匹配 器 将 遇 到 在 
其 表 上 没有 匹配 模式 的 LLIR 对 。 当 这 一 情况 发 生 时 ， 它 能 够 调用 符号 简化 器 来 寻找 一 个 改进 ， 这 使 得 简 
化 器 只 需 在 没有 已 存在 模式 的 LLIR 对 上 进行 搜索 。 

为 了 使 这 一 方法 实用 ， 符 号 简化 器 应 该 既 记 录 成 功 又 记录 失败 。 这 将 充 许 它 在 没有 符号 解释 负荷 的 
情况 下 拒绝 先前 所 看 到 LLIR 对 。 当 它 成 功 改进 一 个 对 时 ， 它 应 该 把 新 的 模式 加 入 优化 器 模式 表 中 ， 使 得 
这 个 对 以 后 的 实例 可 以 由 更 高 效 的 机 制 来 处 理 。 

生成 模式 的 这 一 学 习 方 法 有 几 个 优势 。 它 只 倾 力 于 前 面 没 有 看 到 的 LLIR 对 。 它 填补 目标 机 器 的 训 
练 集合 的 覆盖 范围 中 的 空洞 。 在 保持 大 多 数 模 式 导 向 系统 的 速度 同时 ， 它 提供 高 成 本 系统 所 提供 的 完整 
功能 。 

然而 ， 在 使 用 这 一 方法 时 ， 编 译 器 设计 者 必须 决定 符号 优化 器 什么 时 候 更 新 模式 表 以 及 如 何 调节 这 
些 更 新 。 允 许 任意 编译 重 写 所 有 用 户 的 模式 表 似 乎 是 不 明知 的 ， 这 必定 会 引发 同步 和 安全 的 问题 。 相 反 ， 
编译 器 设计 者 可 以 选择 周期 性 的 更 新 ， 把 新 发 现 的 模式 存储 起 来 ， 使 得 它们 能 够 作为 例 行 的 维护 动作 加 
AR. | 


-11.52 生成 指令 序列 


学 习 方 法 具有 固有 的 偏见 ， 它 假设 低级 模式 应 该 引导 搜索 等 价 的 指令 序列 。 某 些 编译 器 对 于 相同 的 
基础 问题 采用 穷 举 方法 。 取 代 设 法 从 低级 模型 合成 理想 的 指令 序列 ， 它 们 采用 生成 和 测试 方法 。 

想法 很 简单 。 编 译 器 或 编译 器 设计 者 识别 一 个 应 该 得 到 改进 的 汇编 语言 指令 的 短 序列 。 然 后 编译 器 
生成 所 有 代价 为 1 的 汇编 语言 序列 ， 把 原来 的 参数 替换 成 这 一 生成 的 序列 。 它 测试 每 一 个 参数 来 确定 它 
是 否 与 目标 序列 有 相同 的 效应 。 当 它 耗 尽 了 给 定 代价 的 所 有 序列 时 ， 它 增加 序列 的 代价 并 继续 。 这 一 过 
程 一 直 持续 ， 直 到 (1) 它 发 现 一 个 等 价 序列 ，(2) 它 达到 原来 的 目标 序列 的 代价 ， 或 者 (3) 它 达 到 对 
代价 或 编译 时 的 外 部 限制 。 

尽管 这 一 方法 本 质 上 代价 高 昂 ， 但 是 用 于 测试 等 价 性 的 机 制 对 珊 试 每 一 个 候选 序列 所 需 的 时 间 有 很 
强 的 影响 。 使 用 机 器 效应 的 低级 模型 ， 我 们 需要 筛选 出 微妙 的 不 正确 匹配 的 形式 方法 ,但 是 一 个 更 快 的 
测试 可 以 捕获 那些 经 常 出 现 的 不 正确 匹配 。 如 果 编 译 器 简单 地 生成 并 执行 这 一 候选 序列 ， 那 么 它 可 以 把 

一 结果 与 得 自 于 目标 序列 的 结果 相 比较 。 运 用 于 若 于 精 选 的 输入 ， 这 一 简单 的 方法 应 该 以 低 成 本 测试 

消除 大 部 分 不 适用 的 候选 序列 。 

显然 ， 这 一 方法 成 本 太 高 ， 无 法 例 行 地 使 用 或 运用 于 较 大 的 代码 片段 。 然 而 ， 在 某 些 情 况 下 ， 它 值 
得 考虑 。 如 果 应 用 设计 者 或 编译 器 可 以 识别 代码 中 既 小 又 对 性 能 起 决定 因素 的 片段 ， 那 么 优秀 代码 序列 
的 成 效 可 以 证 实 穷 举 搜索 的 代价 的 正当 性 。 例 如 ， 在 某 些 九 入 式 应 用 中 ， 对 性 能 起 决定 性 因素 的 代码 是 


O 符号 化 简 器 可 能 需要 参照 机 器 描述 检查 已 提出 的 模式 ， 以 确保 这 一 简化 不 过 于 一 般 。 例 如 ， 如 果 它 依赖 于 
一 个 操作 数 的 特殊 常量 值 ， 那 么 输入 模式 必须 编码 这 一 限制 。 
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由 一 个 内 循环 组 成 的 。 为 了 改进 速度 或 空间 ， 使 用 穷 举 搜索 寻找 小 的 代码 片段 也 许 是 值得 的 。 

同样 地 ， 穷 举 搜 索 已 用 于 把 编译 器 的 目标 重新 设 定 到 新 的 体系 结构 的 过 程 中 。 这 一 应 用 使 用 穷 举 搜 
索 为 编译 器 反复 生成 的 及 序列 发 现 特别 高 效 的 实现 。 因 为 当 编 译 器 被 移植 时 ， 代 价 被 带 到 移植 后 的 编译 
器 ， 所 以 编译 器 设计 者 可 以 在 使 用 新 编译 器 的 很 多 编译 上 摊派 成 本 来 证 实 搜索 的 正当 性 。 


11.6 概括 和 展望 


就 其 核心 来 说 ， 指 令 筛选 是 模式 匹配 问题 。 这 一 问题 的 难 易 程 度 依赖 于 编译 器 汞 的 抽象 层次 、 目 标 
机 器 的 复杂 性 以 及 对 编译 质量 的 期 望 。 在 某 些 情况 下 ， 简 单 树 遍历 方法 将 产生 足够 的 结果 。 然 而 ， 对 于 
这 一 问题 的 更 加 困难 的 实例 ， 贝 树 模式 匹配 或 者 宽 孔 优化 引导 的 系统 搜索 可 能 产生 更 好 的 结果 。 创 建 能 
达到 相同 结果 的 手工 树 遍历 代码 生成 器 将 需要 更 多 的 工作 。 尽 管 这 两 个 方法 在 绝 大 部 分 的 细节 部 分 是 不 
同 的 ， 但 是 它们 享有 一 个 共同 的 观念 : 运用 模式 匹配 来 在 任意 给 定 IR 程 序 的 各 个 可 能 的 序列 中 寻找 好 的 
代码 序列 。 

通过 在 每 一 个 决策 点 采用 低 成 本 选择 ， 树 模式 匹配 器 发 现 低 成 本 铺盖 。 其 结果 代码 实现 由 IR 程 序 所 
描述 的 计算 。 帘 孔 转 换 器 系统 地 化 简 还 程序 并 参照 目标 机 器 的 神 式 集合 匹配 剩余 的 一 切 。 因 为 它们 缺乏 
显 式 代价 模型 ， 所 以 没有 关于 最 优 的 论据 。 它 们 生成 与 I 程序 有 相同 效应 的 计算 代码 ， 而 不 是 IR 程 序 的 
文字 实现 。 由 于 这 两 个 方法 之 间 的 这 种 细微 差异 ， 我 们 不 能 直接 比较 它们 的 行为 。 在 实践 中 ， 每 一 种 方 
法 都 可 以 得 到 优秀 的 结果 。 

”这 些 技术 的 实际 效益 已 在 真实 的 编译 器 中 得 到 展示 。LCC 和 GCC 都 可 以 在 很 多 平台 上 执行 。 前 者 使 
用 树 模式 匹配 ; 而 后 者 使 用 寞 孔 转换 器 。 在 这 两 个 系统 中 的 自动 工具 的 使 用 已 使 它们 易于 理解 、 易 于 重 
新 设 定 目标 并 最 终 得 到 广泛 的 接受 。 

同样 重要 的 是 ， 读 者 应 该 认识 到 自动 模式 匹配 器 系列 可 以 用 于 编译 的 其 他 问题 。 罕 孔 优化 原本 是 作 
为 改进 编译 器 所 生成 的 最 终 代 码 的 技术 。 同 样 地 ， 编 译 器 可 以 运用 树 模 式 匹配 来 识别 并 重 写 AST 中 的 计 
算 。BURS 技 术 可 以 提供 特别 有 效 的 方法 来 识别 并 改进 简单 模式 ， 包 括 由 值 编号 识别 出 的 代数 等 式 。 


本 章 注释 


大 多 数 早期 编译 器 使 用 手工 编码 、 专 门 的 技术 来 执行 指令 得 选 [251。 对 于 足够 小 的 指令 集合 或 足够 
大 的 编译 器 设计 组 来 说 ， 这 是 可 行 的 。 例 如 ，BLISS-11 编 译 器 使 用 有 限 操作 指令 表 为 PDP-11 生 成 优秀 
的 代码 [339]。 早 期 计算 机 和 小 型 计算 机 的 小 指令 集合 使 研究 者 和 编译 器 设计 者 忽视 在 现代 机 器 上 出 现 的 
某 些 问 题 。 

例如 ，Sethi 和 Ullman[301] 以 及 后 来 的 Aho 和 Johnson[5] 考 虑 了 为 表达 式 树 生 成 最 优 代码 的 问题 。 
Aho、Johnson 和 Ulliman 把 他 们 的 思想 扩展 到 表达 式 DAG[6]。 基 于 这 一 工作 的 编译 器 为 控制 结构 使 用 专 
门 的 方法 ， 并 为 表达 式 树 使 用 聪明 的 算法 。 

在 20 世 纪 70 年 代 后 期 ， 体 系 结构 中 的 两 个 不 同 趋势 把 指令 筛选 的 问题 推 向 编译 器 研究 的 前 沿 。 从 16 
位 到 32 位 体系 结构 的 转移 促成 编译 器 必须 考虑 的 操作 和 地 址 模型 的 数量 的 爆 增 。 对 于 揭示 更 大 可 能 性 的 
编译 器 ， 它 需要 更 加 形式 化 且 更 强大 的 方法 。 与 此 同时 ， 出 色 的 Unix 操 作 系 统 开始 出 现在 多 个 平台 上 。 
这 激 起 对 C 语 言 编译 器 的 自然 需求 ， 并 增加 了 对 可 重 设 日 标 编译 器 的 兴趣 [196]。 指 令 筛 选 器 能 够 轻松 地 
重 设 目标 的 能 力 ， 在 决定 把 编译 器 移植 到 新 体系 结构 的 轻松 度 上 起 着 重要 的 作用 。 这 两 种 倾向 引发 了 始 
于 20 世 纪 70 年 代 的 关于 指令 筛选 的 丰富 研究 成 果 ， 并 在 进入 20 世 纪 90 年 代 后 仍 得 到 良好 的 继续 [155， 
122, 67, 161, 66, 276, 277]. 

自动 扫描 和 分 析 的 成 功 使 得 描述 驱动 指令 筛选 成 为 一 个 有 吸引 力 的 想法 。Glanville 和 Graham 把 指令 
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Se PSK DC A St BA Be sy) HTL155, 160, 162]. GanapathifiFischer ft H Rte RAM x — Al kee 
了 进攻 [151]。 

树 模 式 匹配 代码 生成 器 源 于 表 驱 动 代码 生成 的 早期 工作 [162，40，230，10，175]， 以 及 树 模 式 匹 
配 的 早期 工作 [182，71]。Pelegrf Liopart 在 自 底 向 上 重 写 系统 (BURS) 中 形式 化 了 很 多 概念 [271]。 后 
来 的 作者 在 这 一 工作 的 基础 上 构建 了 一 系列 实现 、 变 形 和 表 生 成 算法 [147，146，276]。 末 梢 (twig) 系 
统 把 树 模式 匹配 和 动态 规划 结合 到 了 一 起 [322，2]。 

第 一 个 罕 孔 优化 器 出 现 于 McKeeman 的 系统 [253]。Bagwell[28]、Wnulf 等 人 [339] 和 Lamb[227] 找 述 了 
早期 的 罕 孔 系统 。11.4.1 节 中 所 描述 的 扩展 、 化 简 和 匹配 循环 来 自 于 Davidson 的 工作 [107，110]。 
Kessler 也 对 直接 从 目标 体系 结构 的 低级 目标 描述 得 到 罕 孔 优化 器 方面 进行 了 研究 [211]。Fraser 和 Wendt 
把 宕 孔 优 化 用 于 执行 代码 生成 [149，150]。11.5.1 节 所 描述 的 机 器 学 习 方 法 是 由 Davidson 和 Fraser 所 描述 
的 [108] 。 

Massalin 提 出 了 11.5.2 节 所 描述 的 穷 举 方法 [251] 。Granlund 和 Kenner 把 这 一 方法 部 分 运用 于 
GCC[165]. 
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12.1 概述 


为 了 执行 而 呈现 的 操作 的 顺序 ， 对 执行 这 些 操作 序列 所 花费 的 时 间 长 短 有 着 重要 的 影响 。 不 同 的 操 
作 花 费 的 时 间 长 短 不 同 。 内 存 系统 可 能 需要 花费 多 于 一 个 周期 的 时 间 来 把 操作 数 传送 到 寄存 器 单元 或 功 
能 单元 。 功 能 单元 本 身 也 可 能 要 花费 儿 个 执行 周期 来 传送 操作 的 结果 。 如 果 一 个 操作 在 一 个 结果 准备 就 
绪 之 前 试图 引用 它 ， 那 么 处 理 器 一 般 都 要 推迟 这 一 操作 的 执行 ， 直 到 这 个 值 准备 就 绪 ， 也 就 是 说 ， 它 售 
顿 (stall)。 用 于 某 些 处 理 器 的 另外 一 种 选择 是 假设 编译 器 可 以 预测 这 些 停顿 并 重 排序 操作 以 避免 这 些 停 
顿 。 如 果 不 能 插入 有 用 的 操作 来 推迟 一 个 操作 ， 那 么 编译 器 必须 插入 一 个 或 多 个 nop。 对 于 前 者 ， 对 这 
一 操作 结果 的 过 早 引 用 将 降低 性 能 。 而 对 于 后 者 ， 硬 件 假设 这 一 问题 从 不 发 生 ， 所 以 当 它 发 生 时 ， 计 算 
产生 不 正确 的 结果 。 编 译 器 应 该 设法 对 指令 进行 排序 来 避免 第 一 个 问题 。 它 必须 避免 第 二 个 问题 。 

很 多 处 理 器 可 以 在 每 一 个 周期 开始 多 个 操作 的 执行 。 这 些 操作 为 了 执行 而 出 现 的 顺序 可 以 决定 在 一 
个 周期 启动 ， 或 发 行 (issue) 的 操作 数量 。 例 如 ， 考 虑 一 个 简单 的 处 理 器 ， 它 带 有 一 个 整数 功能 单元 和 
一 个 浮 点 功能 单元 ， 以 及 一 个 由 100 个 整数 操作 和 100 个 浮 点 操作 组 成 的 已 编译 循环 。 如 果 编译 器 对 这 些 
操作 进行 安排 ， 使 得 前 75 个 操作 是 整数 操作 ， 那 么 浮 点 单元 将 保持 空 站 ， 直 到 处 理 器 最 终 达到 为 它 做 某 
些 工 作为 止 。 如 果 所 有 这 些 操作 都 是 独立 的 (这 是 一 个 不 真实 的 假设 ) ， 那 么 最 好 的 顺序 将 是 在 两 个 单 
元 之 间 交替 操作 。 

非 形 式 地 ， 指 令 调度 是 一 个 过 程 ， 编 译 器 在 这 一 过 程 中 对 已 编译 代码 中 的 操作 进行 重 排序 以 期 望 减 
少 它 的 执行 时 间 。 概 念 上 ， 一 个 指令 调度 器 看 起 来 呈 如 下 形式 : 


源 代 码 重 排序 代码 





指令 调度 器 以 指令 的 偏 序列 表 为 输入 ; 它 产生 由 相同 的 操作 集合 构造 而 来 的 指令 列表 为 输出 。 调 度 器 假 
设 有 一 个 固定 的 操作 集合 ; 与 寄存 器 分 配器 可 能 加 入 溢出 代码 不 同 ， 它 不 加 入 操作 。 调 度 器 假设 一 个 固 
定 的 名 字 空 间 ; 它 不 改变 存储 在 寄存 器 中 的 值 , 尽管 它 可 能 对 某 些 特殊 的 值 重 命名 以 便 消除 寄存 器 冲突 。 
调度 器 通过 改变 操作 序列 来 表示 它 的 结果 。 ; 

指令 调度 器 的 主要 目标 是 保持 作为 输入 而 接受 的 代码 的 意义 ， 且 通过 避免 耗费 在 互 锁 和 停顿 中 的 浪 
费 周期 来 最 小 化 执行 时 间 ， 以 及 避免 由 于 变量 的 生存 期 的 增加 而 引入 额外 的 寄存 器 溢出 。 当 然 ， 这 一 调 
度 器 应 该 高 效 地 操作 。 

如 果 处 理 器 能 够 在 单一 周期 发 行 多 个 操作 ， 那 么 它 必须 拥有 决定 发 行 多 少 个 操作 的 机 制 。 在 一 台 超 
长 指令 字 (VLIW) 机 器 上 ， 处 理 器 在 每 一 个 周期 对 于 每 一 个 功能 单元 发 行 一 个 操作 ， 所 有 操作 被 收集 
到 一 个 固定 格式 的 指令 中 。 一 个 指令 在 每 一 个 槽 中 要 么 包含 一 个 有 用 操作 要 么 包含 一 个 nop。 压 缩 VLIW 
机 器 通过 使 用 可 变 长 度 指令 来 避免 其 中 的 很 多 nop; 指令 流 包 含 让 处 理 器 在 提取 和 解码 的 过 程 中 发 现 指 
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令 边 界 的 信息 。 

超标 量 处 理 器 通过 查看 指令 流 中 后 k 个 操作 来 决定 发 行 的 操作 数量 ， 其 中 古 固定 的 小 整数 。(k 一 般 
等 于 或 稍 大 于 功能 单元 的 数量 。 ) 处 理 器 按 顺 序 检查 每 一 个 操作 ， 并 在 可 能 时 发 行 它 。 当 处 理 器 遇 到 由 
于 资源 的 限制 或 操作 数 的 可 用 性 而 不 能 发 行 的 操作 时 ， 它 停止 发 行 操作 并 等 待 下 一 个 周期 。 无 序 超标 量 
处 理 器 查看 指令 流 上 的 一 个 更 大 的 窗口 。 它 尽 可 能 发 行 更 多 的 操作 ， 跳 过 在 当前 周期 不 能 发 行 的 操作 。 

机 制 的 多 样 性 使 操作 和 指令 之 间 的 差异 变 得 含混 不 清 。 在 VLIW 和 压缩 VLIW 机 器 上 ， 一 个 指令 包 
含 多 个 操作 。 在 超标 量 机 器 上 ， 我 们 通常 把 一 个 操作 作为 一 个 指令 ， 并 把 这 些 机 器 描述 为 在 每 一 个 周期 
发 行 多 个 指令 。 本 书 中 ， 我 们 一 直 在 使 用 术语 操作 (operation) 来 描述 编译 器 希望 在 单一 功能 单元 执行 
的 一 个 操作 码 和 它 的 操作 数 。 调 度 的 讨论 使 用 相同 的 术语 。 调 度 器 对 操作 进行 重 排序 。 按 照 传统 ， 我 们 
” 仍 称 这 一 问题 为 指令 调度 (instruction scheduling ) ， 尽 管 称 为 操作 调度 (operation scheduling) 会 更 精 
确 。 在 VLIW 或 压缩 YLIW 体 系 结构 上 ， 调 度 器 把 操作 包装 成 在 给 定 的 周期 执行 的 指令 。 在 超标 量 体 系 
结构 的 机 器 上 ， 无 论 是 有 序 还 是 无 序 ， 调 度 器 对 操作 进行 重 排序 ， 使 得 处 理 器 在 一 个 周期 尽 可 能 多 地 发 
行 操作 。 

本 章 研 究 调 度 以 及 编译 器 用 于 执行 调度 的 工具 和 技术 。 以 下 几 个 小 节 给 出 讨论 调度 和 理解 算法 及 其 
影响 所 需要 的 背景 信息 。 


12.2 指令 调度 问题 


回想 一 下 1.5 节 给 出 的 指令 调度 的 例子 。 图 12-1 再 次 生成 它 。 标 签 “start” 的 那 一 列 给 出 每 一 个 操作 
开始 执行 的 周期 。 假 设 处 理 器 有 单一 的 功能 单元 ; 内 存 操作 需要 三 个 周期 ; mu1t 需 要 两 个 周期 ; 所 有 其 
他 操作 都 在 一 个 周期 内 完成 。 在 这 些 假设 下 ， 图 左边 所 示 的 源 代码 需要 20 个 周期 。 

图 右边 所 示 的 调度 后 的 代码 要 快 得 多 。 它 把 长 等 待 时 间 操作 从 引用 它们 的 结果 的 操作 中 分 离 出 来 。 
这 一 分 离 使 得 不 依赖 于 这 些 结果 的 操作 与 它们 同时 执行 。 这 一 代码 在 前 三 个 周期 发 行 装 入 操作 ; 其 结果 
分 别 在 周期 4+、5、6 可 用 。 这 一 调度 需要 一 个 额外 的 寄存 器 rs 来 保存 第 三 个 同时 执行 的 装 入 操作 的 结果 ， 
但 是 它 允 许 处 理 器 在 等 待 第 一 个 算法 操作 数 到 来 时 执行 有 用 的 工作 。 各 操作 之 间 的 交 失 有效 地 隐藏 了 内 
存 操作 的 等 待 时 间 。 在 这 个 块 中 运用 的 相同 思想 隐藏 了 mu1t 操 作 的 等 待 时 间 。 重 排序 把 运行 时 间 减 少 到 
13 个 周期 ， 得 到 35% 的 改进 。 

并 非 所 有 块 都 适应 于 这 种 方式 的 改进 。 例 如 ， 考 虑 下 面 计算 x 的 块 : 


n 
Q0 
eN 


un 
oo 
~ 


1 loadAl Tarp Ox > 11 
4 mult risrl > 门 
6 mult risrl > ry 
8 mult iri > ri 
10 storeAI r; => Tarp Ox 


三 个 m1t 操 作 有 长 等 待 时 间 。 遗 憾 的 是 ， 每 一 个 指令 都 使 用 前 一 个 指令 的 结果 。 因 此 ， 调 度 器 对 于 改进 
这 一 代码 没有 什么 可 做 的 ， 因 为 它 没有 在 mu1t 执 行 的 同时 可 以 发 行 的 独立 指令 。 因 为 它 缺 少 可 以 并 行 执 
行 的 独立 操作 ， 所 以 我 们 说 这 个 块 没 有 指令 级 并 行 (instruction-level parallelism ,ILP)。 给 定 充分 的 ILP， 
调度 器 可 以 隐藏 内 存 等 待 时 间 和 功能 单元 等 待 时 间 。 
迄今 为 止 我 们 所 看 到 的 所 有 例子 都 是 隐 式 地 考虑 在 每 一 个 周期 发 行 一 个 操作 的 目标 机 器 。 在 这 样 一 
台 机 器 上 ， 操 作 和 指令 相同 ， 因 为 每 一 个 指令 只 含有 一 个 操作 。 几 乎 所 有 现代 计算 机 都 有 多 个 功能 单元 
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以 及 在 每 一 个 周期 发 行 若干 操作 的 能 力 。 我 们 将 介绍 单一 发 行 机 器 的 列表 调度 算法 ， 并 指出 为 了 处 理 多 
操作 指令 而 扩展 这 一 基础 算法 所 必须 做 的 事情 。 我 们 继续 使 用 术语 操作 来 表示 被 发 行 到 特定 功能 单元 的 
单一 操作 码 ， 且 只 有 当 设计 在 一 个 周期 发 行 的 所 有 操作 的 集合 时 使 用 指令 这 一 词汇 。 在 这 样 的 观点 下 ， 
称 这 一 过 程 为 操作 调度 也 许 更 精确 ; 然而 ， 按 照 传统 ， 我 们 继续 称 这 一 过 程 为 指令 调度 。 

为 了 更 形式 地 定义 调度 ， 我 们 必须 定义 一 个 块 的 相关 图 (dependence graph) D=(N，E)， 有 了 时候 称 
为 这 个 块 的 优先 图 (precedence graph)。 每 一 个 结 点 nEN 是 输入 代码 片段 中 的 一 个 操作 。 存 在 边 e= <m ， 
m2.>EE， 当 上 且 仅 当 n, 使 用 的 结果 作为 操作 数 。 每 一 结 点 除了 边 之 外 ,还 有 两 个 属性 : 类 型 (type) AF 
f} (delay). ee Eee ee ENE AT: 而 且 完成 它 需 要 
delay(n) 个 周期 。 图 12-1 的 例子 产生 图 12-2 所 示 的 相关 图 。 


源 代 码 源 代 码 
loadAl Tarp, @w > r; 
add "is Ty => rj 
loadAI Tarp, @x => rz 


loadAI Tarp, @w > r; 
loadAI Tarp, @x > r2 
loadAI Tarp, @y > r3 
add im = ri 
mult mi nr >r 
loadAI Yarp» @Z > r? 
mult ris T3 Sty 
mult Tis To => r; 
storeAI ri => rarps0 


mult Tis s rñ 
loadAI rarp, @y => rz 
mult Tis Fe > 
loadAI Tarp, @z > rp 
mult rr =r) 
storeAl r; => rarps0 


CNOOk WD 王 


一 
_ 





图 12-1 概述 中 的 调度 例子 


A loadAI 
: add 
loadAI 
mult 
loadAI 


mult 
loadAI 
- mult 
E  storeAl 


示例 代码 





图 12-2 例子 的 相关 图 


在 中 没有 前 驱 的 结 点 ， 例 如 本 例 中 的 g、c、e 和 8 ， 称 为 这 个 相关 图 的 叶子 (leave)。 因 为 这 些 叶 
子 不 依赖 于 其 他 操作 ， 所 以 它们 可 以 尽早 地 被 调度 。 在 D 中 没有 后 继 的 结 点 ， 例 如 本 例 中 的 结 点 ;， 被 称 
为 此 图 的 根 〈root)。 一 个 相关 图 可 以 有 多 个 根 。 在 某 种 意义 下 ， 这 些 根 是 相关 图 中 最 受 限制 的 结 点 ， 因 
为 在 它们 的 祖先 全 都 执行 完毕 之 前 ， 它 们 不 能 执行 。 使 用 这 一 术语 ， 就 如 我 们 是 颠倒 着 画 出 D， 至 少 相 
对 于 早 前 使 用 的 分 析 树 和 抽象 文法 树 是 这 样 的 。 然 而 ， 把 这 些 叶子 置 于 图 的 顶部 的 画 法 使 得 图 中 的 放置 
与 调度 代码 中 的 最 终 放置 之 间 有 粗略 的 对 应 。 叶 子 位 于 树 的 顶部 ， 因 为 它 在 调度 中 可 以 早 些 执行 。 根 位 
于 树 的 底部 ， 因 为 它 必须 在 它 的 每 一 个 祖先 执行 之 后 才能 执行 。 
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给 定 一 个 代码 片段 的 相关 图 PD， 一 个 调度 5 把 每 一 个 结 点 nEN 映 射 到 表示 它 应 该 被 发 行 的 周期 的 一 个 
非 负 整数 ， 假 定 第 一 个 操作 在 周期 1 发 行 。 这 提供 指令 的 清晰 且 精 确 的 定义 ， 也 就 是 说 ， 第 ;个 指令 是 操 
作 的 集合 {nlS(n) = 全 。 一 个 调度 必须 误 足 以 下 3 个 限制 。 

1) 对 于 每 一 个 %EN，S(n) > 1。 这 一 限制 使 得 操作 在 执行 开始 之 前 不 被 改行。 违反 这 一 限制 任意 调 
度 不 是 形式 良好 的 。 出 于 一 致 性 的 原因 ， 这 一 调度 也 必须 至 少 有 一 个 操作 m 有 SGz) = 1。 

2) 如 果 <n,，ny>EE， 那 么 S(n1) + delay(m1) < 5S(n,)。 这 一 限制 保证 正确 性 。 任 意 一 个 操作 在 产生 它 
的 操作 数 的 操作 完成 之 前 不 能 被 发 行 。 违 反 这 一 规则 的 调度 改变 代码 中 的 数据 流 ， 而 且 可 能 产生 不 正确 
的 结果 。 

3) 每 一 个 指令 包含 的 每 一 个 类 型 的 操作 的 数目 不 能 超过 目标 机 器 在 一 个 周期 发 行 的 操作 数目 。 这 
一 限制 保证 可 行 性 ， 因 为 违反 这 一 规则 的 调度 包含 目标 不 可 能 发 行 的 指令 。( 在 VLIW 机 器 上 ， 调 度 器 必 
须 使 用 nop 填 充 指令 中 不 被 使 用 的 槽 。 ) 

编译 器 应 该 只 产生 满足 上 述 三 个 限制 的 调度 。 

给 定 一 个 既 正 确 又 可 行 的 形式 良好 的 调度 ， 假 定 在 周期 1 发 行 第 一 个 指令 ， 这 一 调度 的 长 度 就 是 最 
后 的 操作 完成 时 的 周期 数 。 这 可 以 计算 如 下 : 


L(S) = max(S(n) + delay(n)) 


假设 delay 刻 画 所 有 操作 的 等 待 时 间 ， 调 度 5 应 该 在 L(S) 周期 执行 。 调 度 长 度 的 概念 产生 时 间 - 最 优 
(time-optimal) 调度 的 概念 。 一 个 调度 5; 是 时 间 一 最 优 的， 如 果 L(S) < LOS) 对 于 所 有 其 他 包含 相同 操作 
集合 的 调度 5 都 成 立 。 

相关 图 刻画 这 一 调度 的 重要 性 质 。 计 算 沿 着 通过 这 一 图 的 路 径 的 总 等 待 ， 揭 示 关 于 这 个 块 的 额外 细 
节 。 使 用 相应 的 累加 等 待 时间 的 信息 注释 我 们 例子 的 相关 图 导致 下 面 的 图 : 


图 中 各 结 点 的 上 标 给 出 从 这 一 结 点 到 计算 末端 的 路 径 长 度 。 这 些 值 明 确 指出 路 径 abdfhi 是 最 长 的 ， 它 是 
决定 本 例 整 体 执行 时 间 的 关键 路 径 (critical path). 

那么 编译 器 应 该 如 何 调度 这 一 计算 呢 ? 当 一 个 操作 的 操作 数 是 可 用 的 时 候 ， 它 才能 被 调度 到 一 个 指 
令 中 。 因 为 gs、c、e 和 8 在 这 一 图 中 都 没有 前 驱 ， 所 以 它们 是 调度 的 初始 候选 者 。 4 位 于 关键 路 径 的 事实 
强烈 要 求 把 a 调度 到 第 一 个 指令 中 。 一 旦 a 已 被 调度 ， 剩 余 在 D 中 的 最 长 等 待 时 间 路 径 是 cdefhi;， 这 要 求 c 
作为 第 二 个 指令 被 调度 。 对 于 调度 ac、b 和 e 都 是 形成 最 长 路 径 的 结 点 。 然 而 ，b 需 要 a 的 结果 ， 直 到 第 4 
个 周期 它 才 可 用 。 这 使 得 e 成 为 在 b 后 面 的 最 好 选择 。 继 续 这 一 方式 ， 导 致 调度 acebdgfhi。 这 与 图 12-1 的 
左边 所 示 的 调度 一 致 。 

然而 ， 编 译 器 不 能 简单 地 把 指令 重新 排序 成 所 提议 的 顺序 。 回 想 一 下 ，c 和 e 都 定义 r,，d 使 用 c 存 储 
于 rz 中 的 值 。 调 度 器 不 能 把 e 移 动 到 4 之 前 ， 除 非 它 要 重 命名 e 的 结果 以 避免 与 c 对 rz 的 定义 相 冲 突 。 这 一 
限制 不 是 来 自 于 由 DD 中 的 边 模型 化 的 相关 性 的 数据 流 。 这 是 由 于 调度 需要 避免 与 在 D 中 被 模型 化 的 相关 
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[591] ”性 相干 扰 。 这 些 限制 通常 被 称 为 反 相 关 性 (antidependence)。 


调度 器 至 少 可 以 使 用 两 种 不 同 的 方式 产生 正确 代码 。 它 可 以 发 现存 在 于 输入 代码 中 的 反 相关 性 ， 并 
把 它们 反映 到 最 终 的 调度 中 ， 或 者 它 可 以 重 命名 值 来 避 开 它们 。 本 例 包含 四 个 反 相 关 性 ， 即 e 一 c、e 一 4、 
8 一 ce 和 8 一 /所 有 这 些 都 涉及 rz 的 再 定义 。( 也 存在 基于 mi 的 限制 ， 但 是 每 一 个 关于 m 的 反 相 关 性 与 一 个 
基于 值 流 的 相关 性 重复 。) 

考虑 反 相 关 性 改变 编译 器 可 以 生成 的 调度 集合 。 例 如 ， 它 不 能 把 e 移 到 c 或 4 之 前 。 这 人 迫使 它 生 成 诸 
如 acbdefghi 这 样 的 调度 ， 而 这 一 调度 需要 18 个 周期 。 尽 管 这 一 调度 对 原来 非 调 度 代码 (abcdefghi) 改进 
710%, 但 是 它 与 通过 重 命 名 来 生成 的 如 图 12-1 右 边 所 示 的 acebdgfhi 而 得 到 的 35% 的 改进 无 法 相 比 。 

作为 另 一 个 可 选 的 策略 ， 调 度 器 可 以 系统 地 重 命名 这 一 块 中 的 值 ， 以 便 在 它 调度 代码 之 前 消除 反 相 
关 性 。 这 一 方法 把 调度 器 从 反 相 关 性 强加 的 限制 中 解放 出 来 ， 但 是 它 也 可 能 产生 这 样 的 问题 : 被 调度 代 
码 是 否 需 要 溢出 代码 。 重 命名 的 动作 不 改变 活 变 量 的 数目 ， 它 只 是 改变 它们 的 名 字 并 给 调度 器 交 秋 操作 
的 自由 ,而 反 相关 性 会 妨碍 这 种 自由 。 然 而 ， 增 加 交 琶 可 能 增加 对 寄存 器 的 需求 ， 并 人 迫使 寄存 器 分 配器 
插入 更 多 的 溢出 代码 ， 这 增加 长 等 待 时 间 操 作 并 迫使 另 一 轮 调度 。 

最 简单 的 重 命名 方案 是 把 一 个 新 名 字 赋 给 每 一 个 它 产生 的 值 。 在 我 们 的 例子 中 ， 这 一 方案 产生 如 下 
的 代码 。 代 码 的 这 一 版 本 的 定义 和 使 用 有 相同 的 模式 。 

然而 ， 在 代码 中 非 歧 义 性 地 表示 依赖 关系 。 它 不 包含 反 相关 性 ， 所 以 不 会 出 现 命 名 限制 。 

a: loadAl ro0 一 mi 

b: add rori > r2 

c: loadAI o8 >r 

d:mult rors =r 

-e: 10adAI ro,16 > rs 

f:mult rrs sr 

g: loadAl ro, 24 一 r6. 

h: muit rs, rs =r 

i: storeAl ry => 1,0 


12.2.1 调度 质量 的 其 他 度量 
调度 可 以 用 时 间 之 外 的 其 他 方法 度量 。 对 于 相同 输入 代码 的 两 个 调度 5, 和 5 可 能 产生 对 寄存 器 的 不 


` 同 需 求 ， 也 就 是 说 ，5, 中 的 活 变 量 的 最 大 数量 可 能 比 S, 少 。 如 果 处 理 器 需要 调度 器 为 闲置 的 功能 单元 插 
. 入 nop， 那 么 5; 所 拥有 的 操作 数 可 能 比 5 少 ， 而 且 因 此 可 能 提取 更 少 的 指令 。 这 不 一 定 只 依赖 于 调度 长 度 。 


例如 ， 在 带 有 可 变 周 期 的 nop 的 处 理 器 上 ， 把 nop 捆 绑 到 一 起 可 以 产生 较 少 的 操作 ， 因 而 也 可 能 产生 较 少 
的 指令 。 最 后 ， 在 目标 机 器 上 执行 5 所 需 的 资源 可 能 比 S, 少 ， 因 为 它 从 不 使 用 其 中 一 个 功能 单元 ， 提 取 
较 少 的 指令 ， 或 者 它 较 少 引发 处 理 器 的 指令 解码 器 中 的 位 转换 。 


12.2.2 使 调度 困难 的 因素 


调度 中 的 基本 操作 是 把 操作 收集 到 一 起 形成 基于 这 些 操作 将 开始 执行 的 周期 的 小 组 。 对 于 每 一 个 操 
作 ， 调 度 器 必须 选择 一 个 指令 和 周期 。 对 于 每 一 个 指令 (和 周期 ) 它 必 须 选择 一 组 操作 。 在 平衡 这 两 个 
观点 时 ， 调 度 器 必须 确保 只 有 当 一 个 操作 的 操作 数 是 可 用 时 才能 发 行 它 。 在 一 个 给 定 的 周期 ， 可 能 有 多 
个 操作 满足 这 一 标准 ， 所 以 调度 器 必须 在 其 中 做 出 选择 。 因 为 值 从 它 的 定义 到 它 的 最 后 使 用 是 活 的， 所 
以 调度 器 所 做 的 决策 可 以 通过 把 使 用 移 近 定 义 来 缩短 寄存 器 的 生存 期 ， 或 通过 使 用 远离 定义 而 加 长 寄存 
器 的 生存 期 。 如 果 太 多 的 值 同 时 活着 的 话 ， 那 么 调度 将 是 不 可 行 的 ， 因 为 它 需 要 太 多 的 寄存 器 。 在 寻找 
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最 优 调度 的 同时 ， 平 衡 这 些 因 素 使 调度 复杂 化 。 

除 对 最 简单 的 体系 结构 外 ， 局 部 指令 调度 总 体 来 说 是 NP 完 全 的 。 编 译 器 使 用 贫 禁 搜索 法 产生 调度 
问题 的 近似 解 。 在 实践 中 ， 几 乎 所 有 用 于 编译 器 的 调度 算法 都 基于 启发 式 搜索 技术 的 一 个 系列 ， 称 为 列 
表 调 度 (list scheduling )。 下 面 一 节 详 细 描述 列表 调度 。 接 下 来 的 几 节 将 展示 如 何 把 这 一 范例 扩展 到 更 
大 的 作用 域 。 


指令 调度 与 寄存 器 分 配 之 间 的 关系 

特定 名 字 的 使 用 可 能 引入 反 相关 性 ， 从 而 限制 调度 器 重 排序 操作 的 能 力 。 调 度 器 可 以 通过 重 命 | 
SOT RHR: 然而 ， 重 命名 却 带 来 在 调度 后 编译 器 执行 寄存 器 赋值 的 需求 。 这 只 是 指令 调度 和 | 
寄存 器 分 配 的 相互 作用 的 复杂 方式 的 一 个 例子 。 | 

指令 调度 器 的 核心 功能 是 重 排序 操作 。 因 为 大 多 数 操作 使 用 一 个 或 两 个 值 并 且 产 生 一 个 新 值 ，| 
| 改变 这 些 操作 的 相对 其 序 会 改变 某 些 值 的 生存 期 。 如 果 操 作 a 定 义 r 而 其 后 的 操作 b 定 义 r;， 那 么 把 。 | 
| 移动 到 a 之 前 可 以 有 若干 效应 。 它 可 以 延长 r, 的 生存 期 一 个 周期 ， 而 缩短 的 生存 期 。 如 果 a 的 一 个 | 
| 操作 数 是 一 个 最 后 使 用 ， 那 么 把 p 移 到 a 之 前 延长 这 个 操作 数 的 生存 期 。 对 称 地 ， 如 是 5 的 一 个 操作 | 
数 是 最 后 使 用 ， 那 么 重 排序 可 以 缩短 那个 操作 数 的 生存 期 。 

把 bp 移 到 a 之 前 的 实际 效应 依赖 于 a 和 2 的 细节 以 及 周围 的 代码 。 如 果 所 有 使 用 都 不 是 最 后 使 用 ， 
| 那么 交换 a 和 5 不 会 对 寄存 器 的 需求 产生 实际 影响 。( 每 一 个 操作 定义 一 个 寄存 器 ;交换 操作 的 位 轩 
| 改变 特定 寄存 器 的 生存 期 但 是 对 寄存 器 的 总 体 需求 没有 改变 。 ) | 
| 以 类 似 的 方式 ， 寄 存 器 分 配器 可 以 改变 指令 调度 问题 。 寄 存 器 分 配器 的 核心 功能 是 重 命名 引用 


| 并 当 对 寄存 器 的 需求 比 寄存 器 单元 大 时 插入 内 存 操作 。 这 些 功能 影响 调度 器 产生 快速 代码 的 能 力 。 

| 当 分 配器 把 较 大 的 虚拟 名 字 空 间 上 映射 到 目标 机 器 寄存 器 的 名 字 空 间 时 ， 它 可 以 引入 限制 调度 器 的 反 | 
| 相关 性 。 同 样 地 ， 当 分 配器 插入 溢出 代码 时 ， 它 把 操作 加 入 到 代码 中 ， 而 这 一 代码 本 身 必须 调度 到 | 
指令 中 。 
数学 上 ， 我 们 知道 一 起 解决 这 些 问题 可 能 产生 通过 运行 调度 器 之 后 运行 分 配器 ， 或 者 运行 分 配 | 





12.3 列表 调度 


列表 调度 是 在 一 个 基本 块 中 调度 操作 的 一 种 贪 禁 、 启 发 式 搜 索 方 法 。 自 20 世 纪 70 年 代 后 期 它 已 成 为 
指令 调度 的 主要 范例 ， 这 很 大 程度 上 是 因为 它 发 现 可 行 的 调度 ， 并 很 容易 适应 计算 机 体系 结构 的 改变 。 
然而 ， 列 表 调 度 描 述 的 是 一 种 方法 而 不 一 个 特殊 的 算法 。 它 在 实现 以 及 为 了 调度 而 为 指令 设 定 顺 序 的 尝 
试 上 有 多 种 形式 。 本 节 揭 示 列 表 调 度 的 基本 框架 ， 以 及 基于 这 一 思想 的 几 组 变形 。 

典型 的 列表 调度 操作 于 一 个 基本 块 。 把 我 们 的 考虑 限定 在 代码 的 直线 序列 上 使 得 我 们 可 以 忽视 可 能 
复杂 化 调度 的 情况 。 例 如 ， 当 调度 器 考虑 多 个 块 时 ， 一 个 操作 数 可 能 依赖 于 多 个 前 面 的 定义 ; 这 可 能 为 
这 一 操作 的 操作 数 的 可 使 用 时 间 带 来 不 确定 的 成 份 。 在 它 作用 域 中 使 用 多 个 块 ， 调 度 器 可 能 把 一 个 指令 
从 一 个 块 移 到 另外 一 个 块 中 。 这 样 的 跨 块 间 的 代码 移动 可 能 会 迫使 调度 器 复制 指令 ， 把 这 一 指令 移 到 一 
个 后 继 的 块 中 可 能 导致 每 一 个 后 继 块 都 需要 这 一 拷贝 。 同 样 地 ， 它 可 能 会 引发 一 个 指令 在 一 条 路 径 上 执 
行 ， 而 在 源 代码 中 ， 这 一 指令 不 在 此 路 径 上 执行 : 将 它 移 到 一 个 前 驱 块 中 把 它 放 入 通 向 那个 块 的 每 一 个 
后 继 的 路 径 上 。 把 我 们 的 考虑 限制 在 单一 模块 的 情况 避免 这 些 复杂 性 。 l 
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为 了 把 列表 调度 运用 于 一 个 块 ， 调 度 器 遵照 一 个 四 步 计 划 。 | 

1) 重 命名 以 避免 反 相关 性 。 为 了 减 小 对 调度 器 的 限制 ， 编 译 器 重 命名 值 。 每 一 个 定义 得 到 惟一 名 字 。 
这 一 步 不 是 严格 必要 和 的。 然而 ， 它 却 能 使 调度 器 找到 反 相关 性 阻止 的 调度 。 它 还 简化 调度 器 的 实现 。 

2) 构建 一 个 相关 图 DD。 为 了 构建 相关 图 ， 调 度 器 自 底 向 上 遍历 块 。 对 于 每 一 个 操作 ， 调 度 器 构建 一 
个 结 点 来 表示 新 近 创 建 的 值 。 它 增加 从 那个 结 点 到 使 用 这 个 值 的 每 一 个 结 点 的 边 。 使 用 当前 操作 的 等 待 
时 间 注 释 每 一 条 边 。( 如 果 调 度 器 不 执行 重 命名 ，D 还 必须 表示 反 相 关 性 。) 

3) 给 每 一 个 操作 指定 优先 度 。 当 调度 器 在 每 一 步 从 一 组 可 用 操作 提取 操作 时 ， 它 利用 这 些 优 先 度 
引导 它 自己 。 很 多 优先 度 方案 已 被 用 于 列表 调度 中 。 调 度 器 可 以 为 每 个 结 点 计算 若干 不 同 的 分 数 ， 使 用 
其 中 的 一 个 作为 主要 顺序 ， 而 使 用 其 他 的 分 数 来 排除 同 级 结 点 关系 。 最 受 欢迎 的 优先 度 方 案 使 用 从 这 个 
结 点 到 D 的 一 个 根 的 最 长 等 待 时 间 加 权 路 径 的 长 度 。 我 们 将 在 本 节 后 面 描述 其 他 优先 度 方案 。 

4) 迁 代 选择 一 个 操作 并 对 其 进行 调度 。 列 表 调度 算法 的 核心 数据 结构 是 在 当前 周期 中 可 以 合法 执 
行 的 操作 的 列表 ， 称 为 就 绪 表 (ready list)。 就 绪 表 上 的 每 一 个 操作 的 所 有 操作 数 都 已 可 用 。 算 法 开始 
于 块 中 的 第 一 个 周期 ， 并 尽 可 能 多 地 挑选 出 在 那个 周期 能 发 行 的 操作 。 然 后 它 递增 周期 计数 器 ， 并 更 新 
就 绪 表 以 反映 前 面 已 发 行 的 操作 和 时 间 的 逝去 。 它 重复 这 一 过 程 ， 直 到 每 一 个 操作 已 被 调度 。 

重 命 名 和 构建 D 是 直截了当 的 。 优 先 度 计 算 一 般 涉 及 D 的 一 次 遍历 。 算 法 的 核心 以 及 理解 它 的 关键 
在 于 上 述 最 后 一 步 。 图 12-3 给 出 这 一 步 的 框架 ， 假 定 目标 机 器 有 单一 功能 单元 。 


Cycle + 1 
Ready + leaves of D 
Active + @ 
while (Ready U Active # 0) 
if Ready + @ then 
remove an op from Ready 
S(op) + Cycle l 
add op to Active 
Cycle + + 
for each op € Active 
if S(op) + delay(op) < Cycle then 
femove op from Active 
for each successor s of op in D 
if s is ready 





then add s to Ready 


图 12-3 列表 调度 算法 


这 一 算法 执行 代码 执行 的 一 个 抽象 模拟 。 它 忽视 值 和 操作 的 细节 而 集中 于 由 D 的 边 所 揭示 出 的 时 间 
限制 。 为 了 跟踪 时 间 ， 它 用 变量 Cyc71e 维 护 一 个 模拟 时 钟 。Cyc71e 被 初始 化 为 1 ， 即 被 调度 代码 中 的 第 一 
个 操作 ， 而 且 在 代码 中 每 一 个 操作 都 被 指定 一 个 执行 时 间 为 止 ， 这 个 时 钟 被 依次 递增 。 

这 一 算法 使 用 两 个 列表 来 跟踪 操作 。 第 一 个 列表 Ready 保 存在 当前 周期 可 以 执行 的 所 有 操作 。 如 果 


-一 个 操作 在 Ready 中 ， 那 么 这 一 操作 的 所 有 操作 数 已 被 计算 。 最 初 ，Ready 包 含 D 的 所 有 叶子 ， 因 为 这 些 


叶子 不 依赖 于 其 他 任何 操作 。 第 二 个 列表 4ctfve 保 存在 前 面 的 一 个 周期 已 发 行 但 还 没有 完成 的 所 有 操作 。 
在 每 一 时 间 步 长 处 ， 调 度 器 检查 4ctive 来 发 现 已 完成 的 操作 。 当 一 个 操作 完成 时 ， 调 度 器 检查 这 些 操作 
在 PD 中 的 每 一 个 后 继 (使 用 其 结果 的 操作 ) 来 决定 它 的 所 有 操作 数 现在 是 否 都 是 可 用 的 。 如 果 它 们 都 是 
可 用 的 ， 那 么 它 把 后 继 * 加 到 Ready 中 。 

在 每 一 时 间 步 长 处 ,算法 遵循 一 个 简单 的 规则 。 它 计算 在 前 一 周期 中 完成 的 所 有 操作 ， 然 后 为 当前 
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周期 调度 一 个 操作 。 实 现 的 细节 将 使 这 一 结构 略微 含混 ， 因 为 在 第 一 个 时 间 步 长 处 总 是 有 一 个 空 的 
hctive 列 表 。while 循 环 开始 于 第 一 个 时 间 步 长 的 中 间 。 它 从 Ready 中 挑选 出 一 个 操作 并 调度 它 。 下 一 步 ， 
它 递 增 Cyc1e 来 开始 第 二 个 时 间 步 长 。 它 为 新 周期 的 开始 更 新 4ctive 和 Ready， 然 后 ， 环 线 到 循环 的 顶 
端 ， 在 那里 ， 它 重复 选择 、 递 增 和 更 新 这 一 过 程 。 

当 模拟 时 钟 指出 每 一 个 操作 的 执行 都 已 完成 时 ， 这 一 过 程 终 止 。 在 结尾 处 ，Cyc1e 包 含 块 的 模拟 运 
行 时 间 。 如 果 所 有 操作 都 在 由 delay 所 指定 的 时 间 内 执行 ， 而 且 D 的 叶子 的 所 有 操作 数 在 第 一 个 周期 可 
用 ， 那 么 这 一 模拟 运行 时 间 应 该 与 真实 执行 时 间 匹 配 。 一 个 简单 的 后 序 遍 可 以 重 排序 操作 并 在 空间 其 
插入 nop。 

此 时 ， 一 个 重要 的 问题 是 这 一 方法 所 生成 的 调度 好 到 什么 程度 ?总 体 上 ， 这 一 答案 依赖 于 这 一 算法 
在 每 一 次 选 代 中 是 如 何 从 Ready 列 表 中 挑选 要 消除 的 操作 的 。 考 虑 最 简单 的 情况 ， 这 里 的 Ready 列 表 在 每 
一 次 和 迭代 至 多 包含 一 项 。 在 这 一 限定 的 情况 下 ， 这 一 算法 必 将 生成 最 优 调度 。 只 有 一 个 操作 可 以 在 第 一 
个 周期 执行 。( 在 D 中 至 少 存在 一 个 叶子 ， 而 且 我 们 的 限制 保证 刚好 存在 一 个 叶子 。) 在 每 一 个 后 继 周 期 ， 
算法 没有 选择 的 余地 : 或 者 Ready 包 含 一 个 操作 而 且 算 法 调度 它 ， 或 者 Ready 是 空 的 而 且 算 法 不 调度 任何 
在 那个 周期 发 行 的 操作 。 当 在 这 一 过 程 的 某 一 点 处 多 个 操作 可 用 时 就 会 出 现 困难 。 

在 我 们 的 例子 中 ，D 有 四 个 叶子 :a、c、e 和 g。 只 使 用 一 个 功能 单元 ， 调 度 器 必须 选 出 四 个 装 入 操 
作 中 的 一 个 在 第 一 个 周期 执行 。 这 是 优先 度 计算 的 作用 : 它 给 D 中 的 每 一 个 结 点 赋 一 个 或 多 个 调度 器 用 
于 排序 调度 的 等 级 。 较 前 提出 的 度量 ， 到 中 一 个 根 结 点 的 最 长 等 待 时 间 权 距 离 ， 对 应 于 正在 构建 的 调 
度 中 ， 总 是 选择 位 于 当前 周期 的 关键 路 径 上 的 结 点 。( 改 变 较 早 的 选择 可 能 改变 当前 关键 路 径 。 ) 在 某 种 
程度 上 ， 调 度 优先 度 的 影响 是 可 预测 的 ， 这 一 方案 应 该 提供 最 长 路 径 的 平衡 跟踪 。 


12.3.1 效率 


如 前 所 述 ， 从 Ready 列 表 中 选 出 一 个 操作 需要 Ready 上 的 一 个 线性 扫描 。 这 使 得 创建 并 维护 Ready 的 
代价 接近 0(m*)。 使 用 优先 队列 取代 这 一 列表 可 以 降低 维护 的 代价 到 0(n log2n)， 代 价 使 实现 难度 的 稍 许 增 
加 。 

， 类似 的 方法 可 以 降低 维护 Active 列 表 的 代价 。 当 调度 器 把 一 个 操作 加 到 Active 时 ， 它 可 以 给 这 一 操 
作 指 定 一 个 等 于 这 一 操作 完成 的 周期 的 优先 度 。 寻 找 最 小 优先 度 的 优先 队列 将 把 所 有 在 当前 周期 完成 的 
损 作 都 推 向 队列 的 前 端 ， 相 对 于 简单 的 列表 实现 的 代价 有 稍 许 增加 。 

进一步 改进 Active 的 实现 是 可 能 的 。 调 度 器 可 以 维护 一 个 独立 列表 的 集合 ， 对 应 于 每 一 个 周期 有 一 
个 存放 在 该 周期 可 以 完成 的 操作 的 列表 。 和 覆盖 所 有 操作 等 待 时 间 所 需 的 列表 数量 是 MaxLatency = 
maxucpdelay(n)。 当 编译 器 在 Cyc1e 调 度 一 个 操作 a 时 ， 它 把 a 加 到 WorkListf(Cycle + delay(n))mod 
MaxLatency] 中 。 当 它 要 更 新 Ready 队 列 时 ， 其 后 继 和 需要 考虑 的 所 有 操作 都 在 WorkList[Cycle mod 
MaxLatency] 中 。 对 于 每 一 次 到 WorkL1ist 的 插入 ， 这 一 方案 使 用 少量 额外 空间 和 稍 多 一 点 的 时 间 。 反 之 ， 
它 避免 搜索 4ctive 的 平方 代价 ， 而 且 使 用 线性 遍 更 小 的 Work1ist 来 取代 搜索 4ctive。S 

警告 : 

如 前 所 述 ， 局 部 列表 调度 器 假设 时 子 的 所 有 操作 数 在 这 个 块 的 入 口 处 可 用 。 调 度 器 必须 接受 在 块 的 
边界 处 出 现 的 所 有 效应 。 如 果 处 理 器 具有 在 一 个 操作 数 还 不 可 用 时 停顿 的 互 锁 功 能 ， 那 么 调度 器 可 以 依 
蔗 于 这 些 互 锁 来 保证 互 锁 相关 性 得 到 满足 。 如 果 处 理 器 没有 互 锁 功 能 ， 那 么 调度 器 必须 保证 每 一 个 前 驱 


© 这 些 WorkList 中 的 操作 数目 等 于 Active 中 的 操作 数目 ， 因 此 空间 的 额外 代价 刚好 是 拥有 多 个 WorkList 的 代 
价 。 额 外 的 时 间 来 自 于 引入 了 WorkList 上 的 下 标 计算 ， 包 括 mod 计 算 。 


un 
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块 在 末端 有 足够 的 松弛 时 间 使 所 有 操作 完成 工作 。 使 用 更 多 上 下 文 信息 ， 调 度 器 也 许 能 够 对 叶子 进行 优 
先 排序 ， 以 在 后 继 块 中 隐藏 这 一 松弛 时 间 。 

为 了 扩展 这 一 算法 使 得 它 处 理 包含 多 个 操作 的 指令 ， 我 们 必须 扩展 Wi1e 循 环 ， 使 得 它 为 每 一 个 功 
能 单元 选择 一 个 操作 。 如 果 一 个 给 定 的 操作 可 以 在 若干 不 同 的 功能 单元 中 执行 ， 那 么 编译 器 设计 者 可 能 
需要 根据 那些 功能 单元 的 能 力 进行 操作 选择 。 例 如 ， 如 果 只 有 一 个 功能 单元 可 以 执行 内 存 操作 ， 那 么 调 
度 器 必须 把 装 入 和 存储 优先 地 调度 到 那个 单元 中 。 如 果 寄 存 器 组 被 划分 (参见 13.6.2 节 )， 那 么 将 会 产生 
类 似 的 效应 ;调度 器 也 许 需 要 把 操作 放 到 这 一 操作 的 操作 数 驻 留 的 单元 中 ， 或 者 在 内 部 划分 转换 设备 空 
闲 的 周期 放置 操作 。 

作为 最 后 一 点 ， 内 存 操作 通常 因为 内 存 层 次 的 行为 而 带 有 不 确定 且 可 变 的 等 待 。 在 带 有 多 级 缓冲 内 
存 的 机 器 上 ， 装 入 操作 可 能 有 一 个 从 零 周 期 到 几 百 个 或 几 千 个 周期 的 等 待 范围 。 如 果 调 度 器 假设 最 坏 情 
况 等 待 ， 那 么 它 将 冒 着 长 期 空运 转 处 理 器 的 危险 。 如 果 它 假设 最 好 情况 等 待 ， 它 将 在 缓冲 错误 上 停顿 处 
理 器 。 在 实践 中 ， 编 译 器 可 以 根据 可 用 于 隐藏 装 入 等 待 时 间 的 指令 级 并 行 的 数量 来 计算 每 一 个 装 和 人 的 等 
待 时 间 ， 以 此 来 获取 良好 的 结果 。 事 实 上 ， 这 是 针对 这 一 装 和 人 周围 的 代码 来 调度 这 一 装 和 的， 而 不 是 针 
对 执行 的 硬件 来 调度 的 。 一 旦 这 些 可 用 的 指令 级 并 行 被 用 尽 ， 处 理 器 将 停顿 ， 直 到 这 个 装 人 完成 。 


12.3.2 其 他 的 优先 度 方案 


局 部 指令 调度 的 复杂 性 迫使 编译 器 使 用 启发 式 搜索 技术 。 在 实践 中 ， 列 表 调 度 产 生 良 好 的 调度 ， 这 
是 一 个 近似 最 优 的 调度 。 但 是 ， 这 些 贪 殖 技术 的 行为 很 少 是 健壮 的 ， 输 入 的 较 小 变化 都 可 能 在 结果 上 产 
生 很 大 的 不 同 。 
解决 这 一 不 稳定 性 的 一 个 算法 上 的 方法 是 细心 的 平局 加 赛 。 当 两 个 或 更 多 项 有 相同 的 等 级 时 ， 实 
现 应 该 基于 另 一 个 优先 等 级 在 它们 中 间 做 出 选择 。( 相反 ， 极 大 函数 的 实现 一 般 都 展示 确定 性 的 行为 : 
它们 或 者 保留 第 一 个 最 大 等 级 值 或 者 保留 最 后 最 大 等 级 值 。 这 导致 向 列表 中 的 较 早 结 点 或 较 晚 结 点 的 
系统 偏向 。) 一 个 好 的 列表 调度 器 使 用 若干 不 同 的 优先 度 等 级 来 进行 平局 加 赛 。 文 献 中 介绍 的 优先 度 方 
案 包括 : 
* 一 个 结 点 的 等 级 是 包含 这 个 结 点 的 最 长 路 径 的 总 长 。 在 每 一 步 ， 这 一 方法 偏好 源 代码 中 的 关键 路 
径 ， 而 忽视 中 间 决 策 。 这 倾向 于 忆 的 诬 度 优 先 遍 历 。 
。 一 个 结 点 的 等 级 是 它 在 PD 中 所 拥有 的 立即 后 继 的 数量 。 这 支持 调度 器 跟踪 整个 图 中 的 很 多 不 同 路 
径 ， 更 接近 于 广度 优先 方法 。 它 倾向 于 把 更 多 的 操作 保存 在 Ready 队 列 中 。 
。 一 个 结 点 的 等 级 是 它 在 D 中 所 拥有 的 子孙 的 总 数量 。 这 放大 前 面 等 级 的 效应 。 为 其 他 结 点 计算 关 
键 值 的 结 点 要 早 些 调度 。 
。 如 果 一 个 结 点 有 长 等 待 时 间 ， 那 么 它 的 等 级 则 较 高 。 当 更 多 的 操作 和 留 下 来 可 能 用 于 和 覆盖 结 点 的 等 
待 时 间 时 ， 这 倾向 于 早 些 调度 块 中 长 等 待 时 间 的 结 点 。 
。 如 果 一 个 结 点 包含 一 个 值 的 最 后 使 用 ， 那 么 它 的 等 级 较 高 。 这 倾向 于 通过 把 最 后 使 用 移 近 它 的 定 
义 来 碱 小 对 寄存 器 的 需要 。 
遗憾 的 是 ， 其 中 没有 一 个 调度 方案 在 整体 调度 质量 上 胜 于 其 他 调度 。 每 一 个 方案 在 某 些 例子 上 有 优 
势 ， 而 在 其 他 例子 上 则 毫 无 优势 。 因 此 ， 关 于 使 用 哪个 等 级 方案 以 及 使 用 这 些 等 级 方案 的 顺序 设 有 达成 
共识 。 


12.3.3 前 向 与 向 后 列表 调度 
列表 调度 的 另外 一 种 形式 以 相反 方向 检查 相关 图 ， 从 根 到 叶子 实施 调度 。 被 调度 的 第 一 个 操作 在 块 
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的 最 后 周期 执行 ， 而 被 调度 的 最 后 一 个 操作 则 第 一 个 执行 。 以 这 种 形式 ， 这 一 算法 被 称 为 向 后 列表 调度 
(backward list scheduling), ， 而 原来 版 本 的 调度 称 为 前 向 列表 调度 (forward list scheduling). 

编译 器 领域 的 一 个 标准 实践 是 要 在 每 一 个 块 上 尝试 列表 调度 的 若干 版 本 ， 而 且 保 留 最 短 的 调度 。 编 
译 器 一 般 既 尝试 前 向 列表 调度 ， 又 尝试 向 后 列表 调度 ; 它 可 能 在 每 一 个 方向 上 尝试 多 个 优先 度 方案 。 像 
很 多 技巧 都 来 自 于 试验 一 样 ， 这 一 技巧 编码 若干 重要 的 观点 。 

第 一 ， 列 表 调 度 只 占据 编译 器 执行 时 间 的 一 小 部 分 。 如 果 列 表 调 度 产生 较 好 的 代码 ， 那 么 值得 去 尝 
试 多 个 方案 。 注 意 ， 调 度 器 可 以 复 用 大 部 分 准备 性 工作 : 重 命 名 、 构 建 D 以 及 某 些 已 计算 的 优先 度 。 因 
此 ， 使 用 多 个 方案 的 代价 相当 于 若干 次 重复 调度 器 的 迭代 部 分 。 

第 二 ， 实 践 表明 ， 前 向 和 向 后 调度 都 不 是 长 胜 不 败 的 。 前 向 列表 调度 和 向 后 列表 调度 之 间 的 差异 在 于 
它们 各 自考 虑 的 操作 的 顺序 。 如 果 调 度 决 定性 地 依赖 于 对 某 些 短 操作 序列 的 精心 排序 ， 那 么 这 两 个 方向 上 
的 调度 可 能 产生 显著 不 同 的 结果 。 如 果 关 键 的 操作 在 叶子 附近 出 现 , 向 前 调度 似乎 更 有 可 能 一 起 考虑 它们 ， 
而 向 后 调度 必须 遍历 模块 的 其 余部 分 来 达到 这 些 关键 操作 。 对 称 地 ， 如 果 关 键 操作 出 现在 根 的 附近 ， 那 么 
向 后 调度 有 可 能 一 起 检查 它们 ， 而 前 向 调度 将 以 在 块 的 末端 开始 时 所 做 的 决定 指定 的 顺序 检查 它们 。 

为 了 使 第 二 条 的 讨论 更 具体 些 ， 考 虑 图 12-4 给 出 的 例子 。 这 一 例子 给 出 SPEC 基 准 程序 go 中 的 一 个 
基本 块 的 相关 图 。 编 译 器 把 store 操 作 的 相关 性 加 到 块 结束 分 支 以 确保 内 存 操作 在 下 一 个 块 开 始 执行 之 
前 完成 。( 违 反 这 一 假 设 将 产生 一 系列 装 入 操作 的 不 正确 结 条 . ) 相关 图 上 结 点 的 上 标 给 出 这 一 结 点 到 分 
支 的 等 待 时 间 ; 下 标 区 分 相似 的 操作 。 这 一 例子 假设 相关 图 下 方 的 表格 所 示 的 操作 等 待 时 间 。 


aioadI Slshift 81oadI， SloadI; 81oadI4 


Tadd, Tadd, Tadd, Tadd, 7addI 


| 


cmp store; 5store, 5store; 5store, 5stores 


NN 


lcbr 





操作 码 loadl 1shift add addl cmp store 
等 待 时 间 1 1 2 1 1 4 





图 12-4 go 的 一 个 模块 的 相关 图 


这 一 例子 展示 前 向 和 向 后 列表 调度 之 间 的 差异 。 这 来 自 于 我 们 对 列表 调度 的 研究 ， 编 译 器 以 带 有 两 
个 整数 功能 单元 和 一 个 执行 内 存 操作 的 单元 的 ILOC 机 器 为 目标 。 五 个 store 操 作 花 去 这 个 块 的 大 部 分 时 
间 。 最 小 化 执行 时 间 的 调度 必须 尽 可 能 早 地 开始 执行 各 store 操 作 。 

使 用 到 根 的 等 待 时 间 为 优先 度 ， 除 比较 之 外 ， 向 前 列表 调度 按 优先 度 顺 序 执行 各 操作 。 它 按 等 级 8 
调度 5 个 操作 ， 然 后 按 等 级 7 调度 5 个 操作 。 它 开始 处 理 等 级 为 5 的 操作 ， 将 cmp 沿 着 store 操 作 移 进来 ， 因 
为 cmp 是 叶子 。 如 果 按 从 左 到 右 的 顺序 随意 地 进行 平局 加 赛 ， 那 么 这 产生 如 图 12-5 左 侧 所 未 的 调度 。 注 
意 ， 内 存 操作 在 周期 5 开始 ， 产 生 在 周期 13 发 行 分 支 的 调度 。 

对 向 后 列表 调度 使 用 相同 的 优先 度 ， 编 译 器 首先 把 分 支 放置 到 这 一 块 的 最 后 槽 。cmp 比 它 前 delay 
(cmp) 二 1 个 周期 。 下 一 个 被 调度 的 操作 是 store!( 按 左 到 右 进 行 平局 加 赛 规则 )。 它 被 指定 到 内 存单 元 上 
delay(store) 二 4 周期 前 的 发 行 槽 。 调 度 器 使 用 其 他 store 操 作 相继 填充 这 一 内 存单 元 上 的 更 早 的 档 。 它 


开始 填充 整数 操作 ， 因 它们 已 准备 就 绪 。 第 一 个 是 add， 在 Storei 的 前 两 个 周期 。 当 算法 终止 时 ， 它 产 . 


生 如 图 12-5 右 侧 所 示 的 调度 。 
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图 12-5 go 中 模块 的 调度 


向 后 调度 器 所 产生 的 调度 所 花 的 时 间 比 前 向 调度 器 所 产生 的 调度 所 花 的 时 间 少 一 个 周期 。 向 后 调度 
把 addI 较 早 地 放置 在 块 里 ， 允 许 stores 在 周期 4 发 行 ， 这 比 向 前 调度 中 第 一 个 内 存 操作 提前 一 个 周期 。 
使 用 相同 的 基础 优先 度 和 平局 加 赛 器 ， 以 不 同 的 闫 序 考虑 问题 ， 向 后 算法 得 到 不 同 的 结果 。 

为 什么 会 发 生 这 样 的 情况 呢 ? 向 前 调度 器 必须 在 所 有 等 级 为 7 的 操作 之 前 把 所 有 等 级 为 8 的 操作 放置 
到 调度 中 。 即 使 addI 操 作 是 叶子 ， 其 较 低 的 等 级 促使 前 向 调度 器 等 待 对 它 的 处 理 。 直 到 这 一 调度 器 用 尽 
等 级 8 的 操作 时 ， 等 级 为 7 的 操作 才 可 用 。 与 此 相对 应 ， 向 后 调度 器 在 三 个 等 级 为 8 的 操作 之 前 把 addI 放 
置 到 调度 中 ， 这 是 向 前 调度 器 无 法 考虑 的 结果 。 

列表 调度 算法 使 用 贪 禁 、 启 发 式 搜索 构建 这 一 问题 的 可 行 解决 方案 ， 但 是 等 级 函数 不 编码 这 一 问题 
的 完备 信息 。 为 了 构建 编码 完备 信息 的 等 级 ， 编 译 器 也 许 需要 考虑 所 有 可 能 的 调度 ， 这 使 得 等 级 过 程 自 
身 成 为 NP 完全 问题 。 因 此 ， 除 非 P= NP， 最 优等 级 函数 是 不 切实 际 的 。 


12.3.4 使 用 列表 调度 的 原因 


多 年 来 列表 调度 在 指令 调度 算法 中 一 直 占据 着 统治 地 位 。 以 它 的 前 向 和 向 后 形式 ， 这 一 技术 使 用 贪 
禁 、 启 发 式 搜索 方法 给 每 一 个 操作 在 特定 发 行 梢 指定 特定 指令 。 在 实践 中 ， 这 对 单一 块 产生 卓越 的 效果 。 











| 关于 无 序 执行 | 
一 些 处 理 器 包含 无 序 (000) 执行 指令 的 硬件 支持 。 我 们 称 这 样 的 处 理 器 为 动态 调度 | 
| (dynamically scheduled) 机 器 。 这 并 非 新 特性 ; 例如 ， 它 出 现在 IBM 360/91。 为 了 支持 OOO 执 行 ，| 
动态 调度 处 理 器 检查 指令 流 ， 来 寻找 那些 可 以 在 静态 调度 器 指定 的 执行 位 置 之 前 执行 的 操作 。 为 了 | 
| 做 到 这 一 点 ,动态 调度 处 理 器 在 运行 时 构建 并 维护 相关 图 的 一 个 部 分 。 它 使 用 相关 图 的 这 一 片段 来 | 

发 现 每 一 个 指令 可 以 执行 的 时 间 ， 并 在 第 一 个 合法 机 会 处 发 行 每 一 个 指令 。 
| 无 序 处 理 器 在 什么 时 候 可 以 改进 静态 调度 呢 ? 如 果 运 行 时 环境 比 调 度 器 假设 的 环境 要 好 ， 那 么 | 
| ooo 硬 件 可 以 在 一 个 操作 的 静态 调度 位 置 前 发 行 这 一 操作 。 如 果 一 个 操作 的 操作 数 在 它 的 最 坏 情 况 | 

时 间 之 前 可 用 ， 那 么 这 一 情况 可 能 发 生 在 块 的 边界 处 。 因 为 000 处 理 器 知道 真实 的 运行 时 地 址 ， 所 | 
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| 以 它 也 可 以 消除 某 些 调度 器 所 不 能 消除 的 装 入 -存储 所 依赖 的 歧义 性 ， 
| “000 执行 不 消除 对 指令 调度 的 需求 。 因 为 向 前 看 窗口 是 有 限 的 ， 不 好 的 调度 可 能 不 带 来 改进 。 | 
| 例如 ，50 个 指令 的 向 前 看 窗口 将 不 会 让 处 理 器 按 交 又 的 <inter，floating-point> 对 的 方式 执行 由 100 个 | 
| 整数 指令 捉 后 面 跟着 100 个 浮 点 指令 组 成 的 指令 序列 。 然 而 ， 它 也 许可 以 使 较 短 的 指令 序列 交叉 运 | 
| 行 ， 比 如 说 长 度 为 30 的 申 。OOO 执 行 通过 改进 好 的 但 并 非 最 优 的 调度 来 帮助 编译 器 。 | 
一 个 与 此 相关 的 处 理 器 特性 是 动态 寄存 器 重 命 名 。 与 ISA 人 允许 编译 器 的 命名 相 比 ， 这 一 方案 为 | 
| 处 理 器 提供 更 多 的 物理 寄存 器 。 通 过 使 用 对 编译 器 来 说 不 可 视 的 额外 物理 寄存 器 ， 来 实现 两 个 反 相 | 
| 关 的 引用 ， 这 一 处 理 器 可 以 消除 发 生 在 它 的 向 前 看 窗口 内 的 反 相 关 性 。 





列表 调度 是 高 效 的 。 它 一 次 从 Ready 队 列 移 走 一 个 操作 。 对 于 每 一 个 操作 和 每 一 个 进入 该 操作 的 边 ， 
列表 调度 做 一 次 检查 来 决定 是 否 把 该 操作 加 到 Ready 队 列 中 。 如 果 一 个 操作 有 m 个 操作 数 ， 那 么 调度 器 
访问 它 的 结 点 m 次 。 每 一 次 访问 都 检查 它 的 每 一 个 操作 数 ， 所 以 把 这 一 操作 放置 到 就 绪 队 列 中 所 涉及 的 
工作 量 是 0(m”)。 然 而 ， 对 于 大 多 数 操作 ，m 是 一 或 二 ， 所 以 这 一 平方 代价 是 平凡 的 。 

列表 调度 形成 众多 在 超过 单一 块 的 区 域 上 执行 调度 的 算法 的 基础 。 因 此 ， 了 解 它 的 长 处 和 短处 是 重 
要 的 。 任 意 对 局 部 列表 调度 所 做 的 改进 都 有 改进 区 域 调度 算法 的 可 能 。 


12.4 高 级 话题 


20 世 纪 90 年 代 开 发 的 体系 结构 增加 了 指令 调度 的 重要 性 。 带 有 多 个 功能 单元 的 处 理 器 的 广泛 使 用 、 
管道 的 增加 和 不 断 增长 的 内 存 等 待 时 间 结 合 在 一 起 ， 使 得 实现 的 性 能 更 多 地 依赖 于 执行 顺序 。 这 带 来 更 
具 挑 战 性 的 调度 方法 的 发 展 。12.4.1 节 给 出 3 个 区 域 调 度 方法 。12.4.2 节 介绍 改进 调度 的 代码 整形 。 


12.4.1 区 域 调度 
同 值 编号 一 样 ， 从 单一 基本 块 到 更 大 作用 域 的 转移 可 以 改进 编译 器 生成 的 代码 的 质量 。 对 于 指令 调 


度 ， 已 经 提出 很 多 处 理 较 之 一 个 块 大 但 又 小 于 整个 过 程 的 区 域 的 方法 。 本 节 列 出 派生 于 列表 调度 的 三 个 


方法 。 


1. 调度 扩展 基本 块 

在 扩展 的 基本 块 (EBB) 上 使 用 列表 调度 算法 使 调度 器 考虑 比 
它 在 单一 块 所 能 看 到 的 更 长 的 操作 序列 。 人 穿越 EBB 的 路 径 形成 调度 
器 可 以 按 单一 块 处 理 的 代码 的 直线 片段 。 然 而 ， 这 些 路 径 在 它 第 一 
个 和 最 后 一 个 操作 之 间 存 在 临时 出 中， 而 且 一 些 路 径 可 能 共享 一 个 
公用 前 级 。 当 EBB 调 度 器 跨越 块 边界 移动 操作 时 ， 它 必须 确保 与 该 
块 间 转换 中 相关 的 其 他 路 径 上 的 行为 的 正确 性 。 

考虑 图 12-6 所 示 的 简单 代码 片段 。 它 有 一 个 较 大 的 EBB {B 
B,，Bs，Bs} 和 两 个 平凡 的 EBB，{B;} 和 {B6}。 这 个 较 大 的 EBB 有 两 
个 路 径 {B1，B,，Bs} 和 {B1，B;}。 作 为 一 个 公共 前 织 ， 它 们 共享 B1。 

i H—A j IT DAZ alik 个 

BOE Fe 调度 ， 所 以 它 必须 找到 同时 满足 两 个 路 图 12.6 扩展 基本 块 的 调度 例子 

B, 表 示 的 这 一 冲突 可 以 用 两 种 方法 展示 它 自 己 。 调 度 器 可 能 把 一 个 操作 ， 如 c， 从 已 移出 经 过 已 末端 
的 分 支 进入 B,。 在 这 种 情况 下 ，c 将 不 再 在 从 B1 的 入口 到 B, 的 入 口 的 路 径 上 ， 所 以 调度 者 需要 把 c 的 拷贝 
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插入 B; 以 便 维护 沿 着 路 径 {8,，B,} 的 正确 性 。 另 外 ， 调 度 器 可 能 把 一 个 操作 ， 如 f， 从 B, 向 上 移 到 2B,。 
把 f 放 置 在 从 B, 的 入 口 到 B, 的 入 口 的 路 径 上 ， 此 前 它 并 不 执行 。 

把 f 移 入 B, 中 可 能 带 来 两 个 问题 。 它 加 长 路 径 {B,，B，}， 这 伴随 着 沿 着 那 条 路 径 放 慢 执 行 的 可 能 性 。 
它 也 可 能 改变 那 条 路 径 的 正确 性 。 为 了 避免 后 面 的 问题 ， 编 译 器 必须 重 命名 值 以 遵从 源 代码 中 的 非 相 关 
性 。 而 这 一 重 命名 又 可 能 会 迫使 编译 器 洛 着 控制 流 图 中 的 某 些 边 插入 拷贝 操作 。( 由 此 可 能 引发 的 问题 
类 似 于 在 把 SSA 转 换 成 可 执行 代码 中 所 出 现 的 问题 。 参 见 9.3 节 中 的 讨论 。) 

编译 器 对 于 处 理 这 些 块 间 冲 突 有 若干 选择 。 为 了 处 理 向 下 移动 中 出 现 的 问题 ， 它 可 以 把 补 尝 代 码 
(compensation code) 插入 这 一 路 径 的 出 口 块 中 。 每 当 把 一 个 操作 从 B. 移 到 B, 的 一 个 后 继 中 时 ， 它 必须 考 
虑 在 B, 的 每 一 个 其 他 立即 后 继 中 创建 这 一 指令 的 拷贝 。 如 果 由 这 个 被 移动 的 指令 所 定义 的 值 在 后 继 中 是 
活 的 ， 那 么 这 一 指令 是 必要 的 。 为 了 处 理 向 上 移动 所 产生 的 问题 ， 调 度 器 可 以 阻止 把 一 个 操作 从 原来 块 
移 到 一 个 前 驱 块 中 。 这 避免 加 长 离开 该 前 驱 块 的 其 他 路 径 。 

(还 存在 第 三 个 选择 。 编 译 器 也 许 要 根据 周围 的 上 下 文 复制 块 。 参 见 8.7.1 节 。 在 本 例 中 ， 可 以 复制 
8B; 来 提供 两 个 实现 B; 和 B3， 从 Bs 到 B; 及 从 B; 连 结 到 B; 各 连 一 条 边 。 这 将 创建 包含 新 块 的 更 长 的 EBB。 这 
种 转换 超出 了 当前 所 讨论 的 内 容 。) 

为 了 调度 穿 过 一 个 EBB 的 一 条 路 径 ， 如 果 必 要 的 话 ， 编 译 器 在 这 一 区 域 上 执行 重 命 名 。 接 下 来 ， 它 
构建 整个 路 径 的 单一 相关 图 ， 而 忽视 这 一 路 径 的 任意 出 口 。 它 为 了 在 就 绪 操 作 间 进 行 选择 以 及 进行 平局 
加 赛 计 算 优先 度 。 最 后 ， 同 单一 模块 的 情况 一 样 ， 它 运用 和 迭代 调度 方案 。 每 当 它 把 一 个 操作 指定 给 这 一 
调度 的 特定 周期 的 特殊 指令 时 ， 它 必须 插入 这 一 选择 所 需 的 补偿 代码 。 

编译 器 一 般 对 每 一 个 块 做 一 次 调度 。 因 此 ， 在 我 们 的 例子 中 ， 编 译 器 可 能 首先 调度 路 径 {8,，B，， 
Bs}， 因 为 它 是 最 长 的 路 径 。 接 下 来 调度 {B,，Bs}， 但 是 B81 已 经 有 了 一 个 固定 的 调度 。 因 此 ， 编 译 器 可 以 
使 用 B, 作 为 前 缀 来 调度 8B;。 最 后 ， 它 可 以 《以 任意 顺序 ) 调度 Bs; 和 B。6。 如 果 编 译 器 有 理由 相信 穿越 一 个 
EBB 的 一 条 路 径 比 另外 一 条 路 径 更 频繁 地 执行 ， 那 么 它 应 该 使 该 路 径 优先 并 首先 调度 它 ， 使 得 它 保 留 调 
度 的 完整 性 。 

2. 跟踪 调度 

跟踪 调度 使 用 程序 的 真实 运行 时 行为 的 信息 来 选择 调度 的 区 域 。 它 使 用 通过 运行 这 一 程序 的 测试 版 
而 收集 的 侧面 信息 ， 来 决定 哪个 块 更 频繁 地 执行 。 根 据 这 一 信息 ， 它 构建 一 个 表示 最 频繁 执行 路 径 的 穿 
越 控制 流 图 的 跟踪 ， 或 路 径 。 

给 定 一 个 跟踪 ， 调 度 器 把 列表 调度 算法 运用 于 整个 跟踪 ， 这 与 EBB 调 度 把 列表 调度 算法 运用 于 穿 过 
某 个 EBB 的 一 条 路 径 的 方式 相同 。 对 于 任意 的 跟踪 ， 出 现 另外 一 个 额外 的 复杂 性 : 这 一 跟踪 可 能 有 临时 
入 口 点 和 临时 出 口 点 。 如 果 调 度 器 把 一 个 操作 跨越 一 个 临时 入 口 ( 即 CFG 中 的 一 个 连接 点 ) 向 上 移动 ， 
那么 它 需 要 把 这 个 操作 拷贝 到 进入 这 一 连结 点 的 非 跟踪 路 径 中 。 

为 了 调度 整个 过 程 ， 跟 踪 调 度 器 构建 一 个 跟踪 并 调度 它 。 然 后 ， 它 把 这 一 跟踪 中 的 块 从 考虑 的 对 象 
移出 ,并 选择 下 一 个 最 频繁 执行 的 跟踪 。 这 一 跟踪 被 调度 ， 而 且 调度 必须 反映 由 前 面 的 调度 代码 所 引入 
的 所 有 约束 。 这 一 过 程 持续 下 去 ， 选 择 一 个 跟踪 并 调度 它 ， 并 把 它 移出 考虑 之 列 ， 直 到 所 有 块 都 被 调度 
Hike | 
EBB 调 度 可 以 被 认为 是 跟踪 调度 的 一 种 退化 形式 ， 在 这 一 调度 中 穿 过 这 一 EBB 的 各 条 路 径 恰好 是 由 
某 个 侧面 数据 的 静态 逼近 所 选择 的 跟踪 。 

3. 调度 循环 

因为 循环 在 大 多 数 计算 密集 的 任务 中 起 着 关键 性 的 作用 ， 所 以 在 关于 编译 的 文献 中 ， 人 们 对 它 投 人 
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了 大 量 的 关注 。EBB 调 度 可 以 处 理 循环 体 的 一 个 部 分 ，© 但 是 它 不 能 处 理 从 循环 底部 回 到 循环 顶部 的 
“环绕 ”的 等 待 时 间 。 跟 踪 调 度 可 以 处 理 这 些 环绕 问题 ,但 是 它 需 要 通过 创建 在 这 一 跟踪 中 出 现 多 次 的 
任意 块 的 多 次 拷贝 来 做 到 这 一 点 。 这 些 缺 陷 导致 若干 技术 的 产生 ， 这 些 技术 直接 处 理 这 一 问题 ， 生 成 最 
内 部 循环 的 循环 体 的 优秀 调度 。 

专门 的 循环 调度 技术 只 有 当 缺 省 调度 器 无 法 为 循环 产生 高 效 且 简洁 的 代码 时 才 有 意义 。 调 度 之 后 ， 
如 果 这 一 循环 有 不 含 停顿 、 互 锁 和 nop 的 循环 体 ， 那 么 专门 的 循环 调度 器 也 不 可 能 改进 它 的 性 能 。 同 样 
地 ， 如 果 这 一 循环 的 循环 体 足够 长 ， 使 得 块 末端 效应 只 是 它 的 运行 时 间 的 微小 部 分 ， 那 么 专门 调度 器 也 
不 大 可 能 有 帮助 。 

然而 ， 很 多 小 的 计算 密集 的 循环 仍 受 益 于 循环 调度 。 典 型 地 ， 相 对 于 操作 的 关键 路 径 长 度 ， 这 些 
循环 含有 太 少 的 操作 ， 以 致 于 无 法 保持 基础 硬件 忙碌 。 调 度 这 些 循环 的 关键 是 同时 执行 这 一 循环 的 多 
个 选 代 ， 例 如 ， 使 用 三 次 迭代 执行 ， 给 定 的 周期 可 能 从 第 ;次 迭代 的 开始 、 从 第 ;- 1 次 迭代 的 中 间 以 及 
从 第 i 一 2 次 迭代 的 末端 发 行 操作 。 为 了 创建 这 样 的 调度 ， 调 度 器 创建 一 个 被 称 为 核 (kernel) 的 固定 长 
度 循 环 体 ， 并 使 用 模 算 术 来 调度 它 。 事 实 上 ， 这 把 单一 迭代 的 执行 合 入 核 上 。 这 些 循 环 通常 被 称 为 管 
WLR (pipelined loop). 

为 了 使 管道 化 循环 正确 执行 ， 代 码 必 须 首先 执行 补足 管道 的 序言 部 分 。 如 果 核 执行 来 自 于 原来 循环 
的 三 次 迭代 的 操作 ， 那 么 每 一 次 核 选 代 大 致 处 理 原 循环 的 每 一 个 活动 友 代 的 三 分 之 一 。 为 了 开始 执行 ， 
序言 必须 为 多 代 1 的 最 后 三 分 之 一 ， 和 返 代 2 的 中 间 三 分 之 一 和 和 迭代 3 的 前 三 分 之 一 做 足够 的 准备 工作 。 当 
核 循环 完成 后 ， 需 要 一 个 相应 的 结语 (epilogue) 来 完成 最 后 的 迭代 : 空 出 管道 。 对 独立 的 序言 和 结语 
部 分 的 需求 增加 代码 的 尺寸 。 尽 管 这 一 特定 的 增加 是 循环 和 核 同时 执行 的 选 代 次 数 的 函数 ， 但 是 序言 和 
结束 语 使 循环 所 需 的 代码 量 加 倍 的 情况 并 非 不 常见 。 

下 面 的 例子 将 使 这 一 想法 更 具体 。 考 虑 下 面 用 C 语 言 写 成 的 循环 : 

for (i=1; i < 200; i++) 

z[i] = x[i] * yf]; . 
图 12-7 给 出 在 优化 后 编译 器 可 能 为 这 一 循环 所 生成 的 代码 。 这 时 ， 已 经 运用 了 操作 符 强度 减弱 和 线性 函 
数 测试 替换 (参见 10.3.3 节 )。 上 图 中 的 代码 已 经 为 一 台 带 有 一 个 功能 单元 的 机 器 调度 过 。 调 度 器 假设 装 
人 和 存储 花 三 个 周期 ， 乘 法 花 两 个 周期 而 其 他 所 有 操作 花 一 个 周期 。 第 一 列 给 出 周期 计数 ， 以 循环 中 的 
第 一 个 操作 为 标准 (在 标签 处 )。 

预 循 环 代 码 为 每 一 个 数组 初始 化 一 个 指针 ， 并 计算 循环 末端 测试 在 周期 6 所 使 用 的 rw 的 范围 的 上 界 
rw。 循环 体 装 入 x 和 y 执 行 乘法 ， 并 把 结果 存储 到 z。 调 度 器 使 用 其 他 操作 填充 长 等 待 操作 的 隐藏 区 的 所 
有 发 行 槽 。 在 装 入 的 等 待 时 间 ， 调 度 更 新 re 和 rey。 它 在 乘法 的 隐藏 区 执行 比较 。 它 使 用 re: 的 更 新 和 分 
支 填充 存储 后 的 槽 。 这 为 一 个 功能 单元 机 器 产生 一 个 紧凑 的 调度 。 

考虑 如 果 我 们 在 一 台 带 有 两 个 功能 单元 和 相同 等 待 时 间 的 超标 量 处 理 器 运行 代码 的 话 会 发 生 什么 。 
假设 装 人 和 存储 必须 在 功能 单元 零 上 执行 ， 且 假设 功能 单元 停顿 直到 一 个 操作 的 操作 数 都 已 就 绪 ， 且 处 
理 器 不 能 向 停顿 单元 发 行 操作 。 图 12-8 给 出 循环 的 第 一 次 多 代 的 执行 。 周 期 3 的 mult 停 顿 ， 因 为 rx 和 my 都 
没有 就 绪 。 它 在 周期 4 停顿 ， 等 待 ry， 在 周期 5 重新 开始 执行 ， 且 在 周期 6 的 末端 产生 r:。 这 迫使 storeA0 
到 周期 7 的 开始 一 直 停 顿 。 假 设 硬件 可 以 区 别 rs. 包 含 不 同 于 re 和 rw 的 地 址 ， 那 么 处 理 器 可 以 在 周期 7 为 
第 二 次 迭代 发 行 第 一 个 10adA0。 如 果 不 能 区 别 这 一 信息 ， 那 么 处 理 器 将 停顿 ， 直 到 这 一 存储 完成 。 


日 ”如 果 这 一 循环 只 包含 一 个 模块 ， 那 么 它 无 需 扩 展 基本 模块 。 如 果 它 包含 break 式 的 到 循环 底部 的 跳 转 之 外 的 
任意 内 部 控制 流 ， 那 么 一 个 EBB 不 可 能 包含 它 的 所 有 模块 。 
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功能 单元 0 
load! @x 
loadl @y 
loadl @z 
addI Vex 792 
1 : loadAO rarp, Tex 得 到 x[1] & y[i] 
2 1oadA0 rarp,rey 
3 addI rox, 4 在 装 入 的 隐藏 区 
4 addI rey, 4 递增 指针 
5 mult mxsry 真正 的 工作 
6 Cmp_LT rex,rub mult 的 隐藏 区 
7 storeA0 r, 存储 结果 
8 addI rez, 4 递增 z 的 指针 
9 cbr Pec 循环 结束 分 支 
图 12-7 一 个 功能 单元 的 调度 循环 例子 
功能 单元 0 功能 单元 1 
1oadI @x => Tex loadI @y => Tey 
ToadI @z => Tez addI rex,792 > rub 
: loadAO rarps Pex => rx 无 操作 发 行 
]oadA0 rarp,rey => ry addI rex，4 => rex 
addI rey，4 => rey mult rory > 
Cmp-LT Texsrub => Mee ry 处 停止 
storeA0 rz => VarpsYez addi rez, 4 => rez 
r, 处 停止 cbr > Lisle 
图 12-8 两 功能 单元 超标 量 处 理 器 上 的 执行 
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转移 到 两 功能 单元 改进 了 执行 时 间 。 它 把 预 循环 时 间 削 减 一 半 到 两 个 周期 。 它 减少 三 分 之 一 循环 体 
的 时 间 ， 到 6 个 周期 。 关 键 路 径 可 以 如 我 们 所 愿 快速 执行 ; 乘法 在 ry 可 用 之 前 发 行 且 尽 可 能 早 地 执行 。 
一 且 r: 可 用 ， 存 储 就 开始 进行 。 某 些 释放 模 被 浪费 了 (在 周期 6 时 是 单元 0， 周 期 1 和 4 时 是 单元 1)。 


重 排序 线性 代码 可 以 改变 执行 调度 。 例 如 ， 如 果 把 rw 的 更 新 移 到 从 rw 的 装 人 的 前 面 ， 那 么 处 理 器 可 
以 在 与 从 寄存 器 re 和 rw 的 装 和 人 的 相同 周期 发 行 rw 和 rw 的 更 新 。 这 使 得 某 些 操作 在 调度 中 更 早 释 放 ， 但 


是 它 对 加 速 关键 路 径 没 有 什么 帮助 。 最 终结 果 是 相同 的 : 一 个 6 周期 循环 。 


管道 化 这 一 代码 可 以 减少 每 一 次 迭 代 所 需 的 时 间 。 图 12-9 给 出 经 编译 器 管道 化 之 后 的 相同 循环 。 调 
度 器 在 这 里 已 把 这 一 循环 友 成 一 半 , 使 得 它 的 核 同时 执行 两 次 迭代 。 此 循环 的 序言 (周期 -4 到 -1) 同 
前 面 一 样 执行 初始 化 代码 ， 以 及 选 代 1 的 上 一 半 。 核 执行 选 代 确 下 一 半 和 和 迭代 ;+ 1 的 上 一 半 。 当 核 终止 


时 ， 结 语 (周期 +1 到 +3) 执行 最 后 迭代 的 下 一 半 。 


为 了 理解 管道 化 循环 中 的 值 流 ， 考 虑 图 12-10 所 示 的 执行 。 假 设 这 一 管道 循环 执行 源 循环 的 四 次 选 


代 ， 此 图 给 出 操作 执行 的 顺序 。 箭 头 表示 沿 这 一 循环 的 关键 路 径 的 值 流 ， 两 个 装 和 人、 乘法 和 存储 。 
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ToadI @x ; 
ToadAO Tarp rex 
loadAO Tarp» Tey 
loadl 8@z 


: loadAO Tarp, Tex 


JoadAO Tarps Tey 
cmp_LT Tex» Tub 
storeA0 rz 

cbr Tee 


功能 单元 0 功能 单元 1 


JoadI @y 

addI re, 4 
addI ray, 4 
addl rex,788 


4 
ZE aE E 


addI re, 4 

mult rw,ry 

addI re, 4 
rarpsrez 121 ry 
Lisl addi rez, 4 


+4euy 
yyy ye 


mult rw,ry rz 无 操作 发 行 
storeA0 rz 无 操作 发 行 
stall on ry 无 操作 发 行 





12-9 管道 调度 后 的 循环 示例 



























功能 单元 0 功能 单元 1 
1oadI @x => Vex loadl @y => rey 
10adA0 tarps Pe, 之 mr- 一 一 一 add I rex，4 之 Te, 
loadAO Tarps ley = ry 一 一 一 个 addI Ty, 4 一 rw 
load! &z => Tez | addi rex 788 => mw 
A | j 
Lı: 10adA0 — Tarps ox => rx addI Tns 4 => Pex 
ToadAO ”ramsrey => Fy ere =r, 
Cmp_LT rowTub = Mec addI Tey. 4 => re | 
storeA0 rm i “= Parps Tez i2i rx =r, 
cbr Vee —> Lyk, addI te, 4 一 rez 
第 一 次 核 送 代 , 


Lı: 10adA0 


Lı: 10adA0 


循环 结语 


loadA0 rarsrey => Vy mult 

cmp_LT exe Pun 之 Mee add! Tey, 4 => Ty 

storeAQ ry => Tarps Pez i2i rT 之 六 

cbr Tec > Lisl addI Ye, 4 >To 
第 二 次 核 迭 代 













Farpas = mx add! Tex» 4 => rex 

























addi 





Tarp, "ax = Tx---， Ts 4 = Trex 















1oadA0 rarpsrey = ry---} i mult rx srTy >r 
cmp LT roorw re |! addi rey, 4 之 ro 
storeA0 r, Vapor: ji21 mx -> r: 
cbr Vee > Lyle addI Tere 4 => rp 
BARBER : 
Lz: mult reny atin 无 操作 发 行 


storeA0 r, Srp ”无 操作 发 行 


图 12-10 管道 循环 中 的 值 流向 
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“第 一 次 源 循环 选 代 开始 于 管道 循环 的 序言 并 完成 于 第 一 个 核 选 代 。 这 些 流 向 用 细 灰 线 表 示 。 

。 第 二 次 源 循环 迭代 开始 于 管道 循环 的 第 一 个 核 迭 代 并 完成 于 第 二 次 核 迭 代 。 这 一 流向 用 粗 线 表示 。 

“第 三 次 源 循 环 和 迭代 开始 于 管道 循环 的 第 二 次 核 迁 代 并 完成 于 第 三 次 核 选 代 。 这 一 流向 用 标准 线 

表示 。 

。 最 后 一 次 源 循环 迭代 开始 于 管道 循环 的 第 三 次 〈 最 后 一 个 ) 核 和 迭代。 循环 的 结语 代码 通过 执行 乘 

法 和 存储 完成 最 后 的 和 迭代。 这些 值 流 用 点 线 表 示 。 

最 后 的 存储 操作 停顿 以 等 待 乘法 的 结果 。 结 语 也 包含 某 些 空闲 发 行 槽 。 如 果 调 度 器 有 这 一 循环 周围 
的 更 多 上 下 文 ， 那 么 它 能 够 通过 从 结语 之 后 的 基本 块 中 提升 操作 来 改进 结语 的 调度 。 理 想 情 况 下 ， 它 应 
该 在 乘法 和 存储 操作 之 间 填 充 空闲 发 行 槽 并 插入 另外 一 组 操作 。 

4. 回顾 

本 质 上 ， 管 道 调度 器 把 循环 变 成 一 半 来 减少 花 在 每 一 次 迁 代 上 的 周期 数 。 核 的 执行 次 数 比 原来 的 循 
环 少 一 次 。 序 言 和 结语 都 执行 一 次 迭代 的 一 半 。 管 道 循环 通过 把 迭代 ;的 乘法 和 存储 与 迭代 :+ 1 的 装 入 交 
和 迭 ， 每 一 次 挝 代 它 少 使 用 两 个 周期 。 

产生 管道 循环 的 算法 需要 超出 本 章 范围 的 分 析 技术 。 有 兴趣 的 读者 可 以 查询 有 关 高 级 优化 详细 技术 
的 教科 书 。 


12.4.2 上 下 文 的 复制 


在 图 12-6 的 例子 中 ， 穿 过 EBB(B,，B,，B;，B,) 的 两 条 路 径 都 包含 B 。 编 译 器 必须 首先 选择 调度 一 
条 路 径 ， 或 者 是 (By, B, By) 或 者 是 (Bl，Bs,)。 效 应 是 把 另外 一 条 路 径 分 裂 成 两 半 ; 如 果 编 译 器 首先 
调度 (8B,，8,，B,)， 那 么 它 必 须 对 应 已 调度 的 B, 调 座 B,。 本 例 中 其 他 两 个 EBB 是 由 单一 块 (B;) 和 (B) 
组 成 的 。 因 此 ， 这 些 块 的 一 半 作 为 单一 块 来 调度 ， 任 意 得 自 于 EBB 调 度 的 效应 主要 出 现在 路 径 (8,，B，， 
B) 上 。 通 过 这 一 片段 的 其 他 每 一 条 路 径 都 遇 到 局 部 调度 的 代码 。 

如 果 编 译 器 做 出 了 正确 的 选择 ， 且 B1!、B,、B,s 是 最 频繁 执行 的 路 径 ， 那 么 分 裂 (B, B) 是 合适 的 。 
相反 ， 如 果 另 一 条 路 径 ， 如 (B1，B;，Bs，B6) 执行 得 更 加 频繁 ， 那 么 EBB 调 度 的 效应 被 浪费 掉 了 。 跟 
踪 调 度 可 以 捕获 并 调度 这 一 路 径 。 然 而 ， 跟 踪 调 度 也 展现 调度 第 一 条 路 径 的 倾向 。 

为 了 增加 可 以 被 调度 的 多 块 路 径 的 数量 ， 编 译 器 可 以 通过 复制 基本 块 来 重新 捕获 上 下 文 。 复 制 可 能 
通过 创建 调度 器 有 更 多 改进 代码 的 机 会 的 上 下 文 来 提高 性 能 。 它 也 可 以 降低 当 编 译 器 选择 了 错误 的 执行 
路 径 时 的 性 能 损失 。 使 用 复制 ， 编 译 器 复制 有 多 个 前 驱 的 块 来 创 
建 更 大 的 EBB。 

图 12-11 给 出 图 12-6 的 例子 上 的 这 种 复制 的 执行 结果 。 块 B, 被 
复制 来 创建 从 B, 的 路 径 和 从 B; 的 路 径 的 独立 实例 。 同 样 地 ，B6 被 
复制 两 次 ， 创 建 进入 其 中 的 每 一 条 路 径 的 实例 。 

复制 之 后 ， 整 个 图 形成 一 个 EBBB 。 如 果 编 译 器 选择 (B, B 
B,) 为 紧迫 路 径 ， 那 么 它 将 首先 调度 (By, Bo By, Be). KBE 
要 调度 的 其 他 两 条 路 径 。 它 可 以 使 用 已 调度 的 (B,，B;) 为 上 下 
oX., RS! (B;，B;)。 它 也 可 以 使 用 已 调度 的 (B.) 为 上 下 
X, VAR (B,, Bs, Bi). 

把 这 一 结果 与 简单 EBB 调 度 器 相对 比 ， 后 者 对 应 于 B 调 度 B,， 
且 Bs 和 Be 都 没有 前 上 下 文 。 因 为 Bs; 和 Be 有 多 个 前 驱 和 不 一 致 的 上 
下 文 ， 所 以 EBB 调 度 器 不 可 能 比 局 部 调度 做 得 更 好 。 创 建 给 调度 。 图 12-11 通过 复制 增加 调度 上 下 文 
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MUS LF XRB ANB AIMS DL RT AE ORI — TAB AN FE 
实践 中 ， 编 译 器 可 以 把 8 和 B6、B5 和 B5、 以 及 B3 和 8 组 合成 对 。 这 可 以 消除 每 个 对 中 第 一 个 块 的 块 末端 
跳 转 。 l . 
当然 ， 编 译 器 设计 者 对 这 种 类 型 的 复制 加 入 某 些 限制 以 避免 过 分 的 代码 增长 以 及 避免 循环 的 展开 。 
典型 的 实现 可 以 在 最 内 层 的 循环 内 复制 块 ， 当 它 达 到 循环 关闭 边 或 返回 边 时 停止 复制 。 这 创建 一 种 环境 ， 
在 这 一 环境 中 ,循环 中 仅 有 的 多 人口 块 是 第 一 个 块 。 所 有 其 他 路 径 只 有 单一 入 口 块 。 
















度量 运行 时 性 能 
指令 调度 的 主要 目的 是 改进 已 生成 代码 的 运行 时 间 。 性 能 的 讨论 使 用 很 多 不 同 的 度量 标准 ; 其 | 
中 有 两 个 最 为 常用 。 | 有 
每 秒 指令 数 ” 通 常用 于 告知 计算 机 和 比较 系统 性 能 的 这 一 度量 标准 是 一 秒 内 执行 的 指令 数量 。 | 
这 可 以 用 于 测量 每 秒 发 行 的 指令 或 每 秒 内 退出 的 指令 的 数目 。 
完成 一 项 国定 任务 的 时 间 ”这 一 度量 标准 使 用 一 个 或 多 个 行为 已 知 的 程序 ， 并 比较 完成 这 些 固 | 
定 任务 所 需 的 时 间 。 这 一 称 为 基准 测试 (benchmarking) 的 方法 提供 某 一 特定 作业 量 上 硬件 和 软件 | 
| 的 总 体系 统 性 能 的 信息 。 l | 
没有 哪 一 个 标准 独自 包含 足够 多 的 信息 , 使 得 编译 器 后 端 生 成 的 代码 的 质量 评估 得 到 认可 。 例如 ， 
| 如 果 度 量 是 每 秒 指令 数 ， 那 么 编译 器 获得 关于 把 无 关 (但 独立 ) 的 指令 留 在 代码 中 的 信息 了 吗 ? 这 一 | 
| 简单 的 测 时 标准 不 能 提供 给 定 程序 可 实现 程度 的 信息 。 因 此 ， 它 允许 一 个 编译 器 比 另外 一 个 编译 器 做 | 
得 更 好 ， 但 是 却 不 能 展示 已 生成 代码 之 间 的 差异 ， 以 及 在 目标 机 器 上 这 一 代码 的 最 优 性 能 。 | 
| 编译 器 设计 者 想 要 测量 的 数目 包括 其 结果 的 确 被 使 用 的 已 执行 指令 的 百分比 ， 以 及 花费 在 停顿 
| 和 互 镇 中 的 周期 的 百分比 。 前 者 给 出 预测 执行 的 某 些 方面 的 信息 ， 而 后 者 直接 测量 调度 质量 的 某 些 | 
方面 的 信息 。 






”值得 考虑 的 第 二 个 问题 出 现 于 尾 递归 程序 中 。 回 想 一 下 ， 根 据 7.8.2 节 ， 一 个 程序 是 尾 递 归 的 ， 如 果 
它 的 最 后 动作 是 一 个 递归 自 调用 。 当 编译 器 发 现 一 个 尾 调用 时 ， 它 可 以 把 这 一 调用 转换 成 到 这 一 过 程 人 
口 的 一 个 向 回 跳 转 。 从 调度 器 的 观点 看 ， 复 制 可 能 改进 这 种 情况 。 


图 12-12 左 侧 给 出 昆 递 归 例 程 在 尾 调用 被 转换 成 选 代 之 后 的 抽象 化 控制 流 。 沼 着 两 条 路 径 进入 块 B,， 


一 条 路 径 是 这 一 过 程 的 人口 路 径 ， 另 一 条 路 径 是 从 8 的 路 径 。 这 人 迫使 调度 器 对 领先 3 的 块 做 最 坏 情 况 假 
设 。 如 图 右 侧 所 示 ， 通 过 复制 8,， 编 译 器 可 以 使 控制 只 沿 着 一 条 边 进 入 Bi。 这 可 能 改进 使 用 EBB 调 度 器 
或 循环 调度 器 的 区 域 调度 结果 。 为 了 进一步 简化 这 一 情况 ， 编 译 器 可 以 把 B; 结 合 到 B, 的 末端 ， 创 建 一 个 
单一 块 循环 体 。 可 以 使 用 局 部 调度 器 或 循环 调度 器 调度 其 结果 循环 。 


A | B, | 出 口 AH 四 HEO 


om 
经 把 尾 递归 转换 成 复制 之 后 
迭代 后 的 源 代码 


图 12-12 
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12.5 概括 和 展望 


. 为 了 在 现代 处 理 器 上 得 到 可 行 的 性 能 ， 编 译 器 必须 精心 地 调度 操作 。 几 乎 所 有 现代 编译 器 都 使 用 列 
表 调 度 的 某 种 形式 。 通 过 改变 优先 度 方案 、 平 局 加 赛 规则 以 及 甚至 是 调度 的 方向 ， 这 一 算法 很 容易 调整 
并 参数 化 。 它 在 范围 广大 的 不 同 代码 上 产生 良好 的 结果 , .在 这 一 意义 下 ， 列 表 调 度 是 健壮 的 。 在 实践 中 ， 
它 通 常 找到 时 间 最 优 的 调度 。 

回应 现实 的 问题 ， 操 作 于 更 大 区 域 上 的 列表 调度 的 变形 已 经 得 到 发 展 。 调 度 扩展 基本 块 和 循环 的 技 
术 ， 本 质 上 对 应 于 编译 器 必须 考虑 的 管道 的 数量 以 及 它们 各 自 的 等 待 时 间 的 增加 。 随 着 机 器 变 得 更 加 复 
杂 ， 调 度 器 也 需要 更 多 的 上 下 文 来 发 现 足够 多 的 指令 级 并 行 以 保持 机 器 忙碌 。 软 件 管道 化 为 增加 每 一 周 
期 发 行 的 操作 数量 提供 一 种 方法 ， 而 且 它 减少 执行 循环 的 总 时 间 。 跟 踪 调 度 是 为 VYLIW 体 系 结构 而 发 展 
起 来 的 ， 为 了 它 ， 编 译 器 需要 保持 更 多 的 功能 单元 忙碌 。 


本 章 注释 


很 多 领域 都 引发 调度 问题 ， 其 范围 涉及 建筑 、 工 业 生产 、 服 务 传 输 以 及 在 太空 船上 获得 有 效 负载 等 
领域 。 关 于 调度 的 文献 也 很 多 ， 其 中 包括 很 多 这 一 问题 的 特 化 变形 。 指 令 调度 从 20 世 纪 60 年 代 开 始 就 已 
作为 狼 立 问题 得 到 广泛 的 研究 。 

存在 对 于 简单 情况 保证 最 优 调度 的 算法 。 例 如 ， 在 带 有 一 个 功能 单元 和 统一 的 操作 等 待 时 间 的 机 器 
上 ，Sethi-Ullman 的 标签 算法 为 表达 式 树 创建 最 优 调度 [301]。 它 可 以 运用 于 产生 表达 式 DAG 的 好 代码 。 
Fischer 和 Proebsting 基 于 标签 算法 构建 了 为 小 内 存 等 待 时 间 产 生 最 优 或 近似 最 优 结果 的 算法 [2781。 遗 憾 
的 是 ， 当 等 待 时 间 上 升 或 功能 单元 数量 变 大 时 ， 这 一 算法 就 有 了 麻烦 。 

关于 指令 调度 的 大 部 分 文献 研究 本 章 所 述 列表 调度 算法 的 不 同 版 本 。Landskov 等 被 公认 为 是 做 了 列 
表 调 度 的 权威 性 工作 [229]， 但 是 这 一 算法 至 少 要 回 漳 到 1961 年 的 Helier 的 工作 [178]。 基 于 列表 调度 的 其 
他 文献 包括 Bernstein 和 Rodeh[37]、Gibbons 和 Muchnick[154] ， 以 及 Hennessy 和 Gross[179] 的 文献 。 
Krishnamurthy 等 发 表 了 关于 管道 化 处 理 器 文献 的 高 水 平 概览 [224， 311]。Kerns、Lo 和 Eggers 作 为 使 列 
表 调 度 适 合 于 不 定 内 存 等 待 时 间 的 方法 开发 了 平衡 调度 [210，240]。 

很 多 作者 描述 了 区 域 调度 算法 。 第 一 个 自动 区 域 技术 是 Fisher 的 跟踪 调度 算法 [141，142]。 这 一 算 
法 用 于 若干 商业 系统 [128 ，242] 和 众多 研究 系统 [310]。 另 外 ，Hwu 等 提出 了 超 块 (superblock) 算法 
[190]; 在 一 个 循环 内 部 ， 它 按 与 图 12-11 所 示 的 算法 类 似 的 形式 复制 块 来 避 开 连结 点 。Click 基 于 全 局 值 
图 的 运用 提出 了 全 局 调度 算法 [801。 若 干 作者 提出 了 利用 特定 硬件 特性 的 技术 [310 ，2921。 其 他 利用 复 
制 改 进 调 度 的 方法 包括 Ebcioglu 和 Nakatani[127] 以 及 Gupta 和 Soffa[ 167] 。 Sweany 和 Beaty 提 出 了 基于 支配 
信息 选择 路 径 的 方法 1316]; 其 他 文献 研究 了 这 一 方法 的 不 同方 面 315，189，98] 。 

软件 管道 化 已 经 得 到 广泛 的 探究 。Rau 和 Glaeser 于 1981 年 引进 了 这 一 思想 [283]。Lam 展 示 了 一 个 软 
件 管道 化 算法 ， 这 一 算法 包含 处 理 循环 中 的 控制 流 的 分 层 方 案 [226]。 在 同一 个 学 术 会 议 上 ，Aiken 和 
Nicolau 提 出 了 称 之 为 理想 管道 化 《perfect pipelining) 的 类 似 方法 [11]。 

图 12-4 中 的 向 后 与 前 向 调度 的 例子 是 Philip Schielke 提 供给 我 们 的 [298]。 该 例子 引 自 SPEC 基 准 测 试 
程序 90。 简 明 地 说 ， 它 刻画 一 种 效应 ， 这 一 效应 促使 很 多 编译 器 设计 者 在 他 们 的 编译 器 后 端 同时 加 入 前 
向 和 向 后 调度 器 。 


a 
= 
~ 


第 13 章 
寄存 器 分 配 


13.1 概述 


寄存 器 是 内 存 层 次 结构 中 最 快 的 场所 。 它 们 通常 只 是 大 多 数 操作 可 以 直接 存 取 的 存储 单元 。 寄 存 器 
与 功能 单元 相 邻 而 居 的 事实 邻近 使 得 寄存 器 的 充分 利用 成 为 执行 时 性 能 的 重要 因素 。 在 已 编译 代码 中 ， 
充分 利用 目标 机 器 的 寄存 器 集合 的 责任 落 在 寄存 器 分 配器 上 。 

在 程序 的 每 一 点 ， 寄 存 器 分 配器 决定 哪些 值 将 驻 留 在 寄存 器 中 ， 哪 个 寄存 器 将 保存 这 些 值 中 的 每 一 
个 。 如 果 分 配器 在 一 个 值 的 生存 期 不 能 把 它 保 存在 寄存 器 中 ， 那 么 在 这 个 值 的 整个 生存 期 或 某 一 期 间 ， 
分 配器 必须 将 它 存储 于 内 存 中 。 分 配器 可 能 因 代码 所 包含 的 活 值 比 目 标 机 器 寄存 器 集合 所 能 保存 的 活 值 
要 多 ， 而 把 值 移交 到 内 存 中 。 另 外 ， 在 这 个 值 的 使 用 期 间 ， 分 配器 也 许 因 不 能 证 明 它 可 以 安全 地 驻 留 在 
寄存 器 中 而 把 它 保存 在 内 存 中 。 

寄存 器 分 配器 概念 上 把 使 用 任意 数量 寄存 器 的 程序 作为 它 的 输入 。 它 产生 一 个 适合 目标 机 器 寄存 器 
单元 的 等 价 程序 作为 输出 。 


输入 程序 输出 程序 
n 个 寄存 器 m 个 寄存 器 


当 分 配器 不 能 把 某 个 值 保留 在 寄存 器 中 时 ， 它 必须 把 这 个 值 存储 到 内 存 ， 并 当 它 再 一 次 被 需要 时 装 
入 它 。 这 一 过 程 称 为 溢出 (spilling) 这 个 值 到 内 存 。 

寄存 器 分 配器 的 一 般 目标 是 高 效 地 使 用 目标 机 器 提供 的 寄存 器 单元 。 这 包括 最 小 化 实现 溢出 所 要 执 
行 的 装 入 和 存储 操作 的 数量 。 然 而 ， 其 他 目标 也 是 可 能 的 。 例 如 ， 在 一 个 内 存 受 限 环境 中 ， 用 户 也 许 希 
望 分 配器 最 小 化 分 配 的 内 存 影响 ， 即 最 小 化 保存 被 溢出 值 的 数据 存储 器 和 保存 溢出 操作 的 代码 存储 器 。 

寄存 器 分 配 中 的 一 个 不 好 的 决定 会 使 某 些 应 该 驻 留 在 寄存 器 中 的 值 溢出 。 这 样 的 额外 溢出 代码 的 代 
价 将 提升 内 存 等 待 时 间 。 因 此 ， 在 20 世 纪 90 年 代 内 存 速 度 和 处 理 器 速度 的 差异 增加 了 寄存 器 分 配对 编译 
代码 性 能 的 影响 。 

下 一 节 回 顾 创建 寄存 器 分 配器 操作 环境 的 某 些 背景 问题 。 以 后 各 节 讨 论 寄存 器 分 配 的 算法 以 及 局 部 
作用 域 和 全 局 作用 域内 的 赋值 算法 。 


13.2 背景 问题 


寄存 器 分 配器 取 几 平 完 全 编译 完毕 的 代码 为 输入 ， 这 一 代码 已 经 经 过 扫描 、 语 法 分 析 、 检 查 、 分 析 
和 优化 ， 并 被 重 写 为 目标 机 器 代码 ， 它 还 可 能 要 经 过 了 调度 。 分 配器 必须 通过 插入 在 寄存 器 和 内 存 之 间 
移动 值 的 操作 ， 使 这 一 代码 适合 目标 机 器 的 寄存 器 单元 。 编 译 器 的 早期 阶段 所 做 的 大 部 分 决定 影响 分 配 
器 的 任务 ， 就 如 同 目标 机 器 的 指令 集合 的 性 质 影响 分 配器 的 任务 一 样 。 本 节 揭 示 在 寄存 器 分 配器 的 角色 
形成 中 起 着 重要 作用 的 因素 。 
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13.2.1 内 存 与 寄存 器 


编译 器 设计 者 所 选择 的 内 存 模 型 (参见 5.6.2 节 ) 定义 了 分 配器 必须 处 理 的 问题 的 很 多 细节 。 在 寄存 
器 到 寄存 器 模型 中 ， 通 过 使 所 有 歧义 性 值 驻 留 在 虚拟 寄存 器 中 ， 编 译 器 的 早期 阶段 直接 把 它们 关于 内 存 
引用 的 歧义 性 信息 编码 到 了 蕉 程序 的 形态 中 。 了 蕉 程序 中 基于 内 存 的 那些 值 被 假设 是 玻 义 的 〈 参 见 7.2 节 )， 
所 以 分 配器 把 这 些 值 留 在 内 存 中 。 

在 内 存 到 内 存 模 型 中 ， 分 配器 没有 代码 形态 这 一 线索 。IR 程 序 把 所 有 值 保存 在 内 存 中 ， 而 且 当 它们 
被 使 用 和 定义 时 ， 它 把 这 些 值 移 进 、 移 出 寄存 器 。 分 配器 必须 决定 娃 些 值 是 非 歧 义 的 ， 因 而 可 以 安全 地 
被 保存 于 寄存 器 中 。 然 后 ， 它 必须 决定 把 这 些 值 保存 在 寄存 器 是 否 是 有 益 的 。 在 这 一 模型 中 ， 分 配器 作 
为 输入 得 到 的 代码 一 般 使 用 较 少 的 寄存 器 ， 且 与 等 价 的 寄存 器 到 寄存 器 代码 相 比 执行 更 多 的 内 存 操 作 。 
为 了 得 到 好 性 能 ， 分 配器 需要 尽 它 所 能 把 更 多 的 基于 内 存 的 值 提升 到 寄存 器 中 。 

因此 ， 内 存 模 型 的 选择 从 根本 上 决定 分 配器 的 任务 。 在 上 述 两 种 情况 下 ， 分 配器 的 目标 都 是 减少 最 
终 代 码 在 寄存 器 和 内 存 之 间 要 执行 的 把 值 移 回 、 移 进 的 装 入 和 存储 操作 的 数量 。 在 寄存 器 到 寄存 器 的 模 
型 中 ， 分 配 是 产生 合法 代码 过 程 的 必要 部 分 ; 它 确 保 最 终 代码 适合 目标 机 器 的 寄存 器 单元 。 分 配器 插入 
装 入 和 存储 操作 把 某 些 基于 寄存 器 的 值 移 到 内 存 中 ， 一 般 是 在 对 寄存 器 的 需求 超出 处 理 器 的 供给 的 范围 
内 进行 。 分 配器 设法 最 小 化 它 所 插入 的 装 入 和 存储 操作 的 影响 。 

相反 ， 使 用 内 存 到 内 存 模型 的 编译 器 中 的 分 配器 是 改进 合法 程序 性 能 的 一 种 优化 。 分 配器 决定 把 某 
些 基 于 内 存 的 值 保存 在 寄存 器 中 ， 从 而 使 程序 中 的 某 些 装 人 和 存储 成 为 不 必要 的 。 分 配器 设法 消除 尽 可 
能 多 的 装 入 和 存储 ， 因 为 这 可 以 显著 地 改进 最 终 代 码 的 性 能 。 

因此 ， 信 息 的 缺乏 ， 即 编译 器 分 析 中 的 限制 ， 会 使 编译 器 无 法 把 一 个 变量 分 配 到 寄存 器 中 ， 当 单一 
代码 序列 沿 着 不 同 路 径 继承 不 同 的 环境 时 ， 也 可 能 出 现 这 一 情况 。 有 关 编 译 器 可 能 了 解 的 信息 的 这 些 限 
制 倾向 于 使 用 寄存 器 到 寄存 器 模型 。 寄 存 器 到 寄存 器 模型 为 编译 器 的 其 他 部 分 提供 编码 关于 歧义 性 和 惟 
一 性 信息 的 机 制 。 这 一 信息 可 能 来 自 于 分 析 ; 它 也 可 能 来 自 于 对 复杂 结构 的 翻译 的 理解 ， 其 至 可 能 来 自 
于 分 析 器 中 的 源 文本 。 


13.2.2 分 配 与 赋值 


在 现代 编译 器 中 ， 寄 存 器 分 配器 解决 两 个 不 同 的 问题 : 寄存 咒 分 配 和 寄存 器 峰值 ， 这 在 过 去 是 分 别 
处 理 的 。 这 两 个 问题 有 关联 但 不 相同 。 

1) 分 配 寄存 器 分 配 把 名 字 的 非 限定 集合 映射 到 目标 机 器 提供 的 寄存 器 的 特定 集合 上 。 在 寄存 器 
到 寄存 器 模型 中 ， 寄 存 器 分 配 把 虚拟 寄存 器 上 映射 到 一 组 模型 化 物理 寄存 器 集合 的 新 名 字 集 合 上 ， 并 溢出 
不 适合 这 一 寄存 器 集合 的 值 。 在 内 存 到 内 存 模型 中 ， 寄 存 器 分 配 把 内 存 位 置 的 某 个 子 集 映 射 到 模型 化 物 
理 寄 存 器 集合 的 名 字 集 合 上 。 分 配 保证 代码 在 每 一 条 指令 都 适合 目标 机 器 的 寄存 器 集合 。 

2) 赋值 ”寄存 器 赋值 把 已 分 配 的 名 字 集 合 映射 到 目标 机 器 的 物理 寄存 器 上 。 寄 存 器 赋值 假设 分 配 
已 执行 完毕 ， 所 以 这 一 代码 将 适合 目标 机 器 提供 的 物理 寄存 器 集合 。 因 此 ， 在 已 生成 代码 中 的 每 一 个 指 
令 处 ， 被 指定 驻 留 于 寄存 器 中 的 值 不 超过 Kk 个， 其 中 k 是 物理 寄存 器 的 数量 。 赋值 产生 可 执行 代码 所 需 的 


”真实 寄存 器 名 字 。 


在 几乎 所 有 的 现实 的 形式 中 ， 寄 存 器 分 配 都 是 NP 完全 的 。 对 于 所 有 数据 值 都 有 相同 存储 长 度 的 单 
一 基本 块 ， 最 优 分 配 可 以 在 多 项 式 时 间 内 进行 ， 只 要 把 值 存 放 回 到 内 存 的 代价 是 统一 的 。 这 一 问题 中 儿 
平 任意 的 额外 复杂 性 都 使 它 成 为 NP 完全 间 题 。 例 如， 把 数据 项 的 存储 长 度 增加 到 两 种 ， 例 如 增加 保存 
双 精 度 浮 点 数 的 寄存 器 对 ， 可 以 使 这 一 问题 成 为 NP 完全 。 另 外 ， 增 加 一 个 真实 的 内 存 模型 ， 或 增加 某 
些 值 无 需 存储 回 到 内 存 的 事实 也 会 使 这 一 问题 成 为 NP 完全 。 扩 展 分 配 的 作用 域 来 包含 控制 流 和 多 个 块 





FRED 359 


也 使 这 一 问题 成 为 NP 完 全 。 在 实践 中 ， 任 意 现 实 系统 的 编译 中 都 会 出 现 一 个 或 多 个 这 样 的 问题 。 在 很 
多 情况 下 ， 这 些 问 题 都 会 出 现 。 

在 很 多 情况 下 ， 寄 存 器 赋值 可 以 在 多 项 式 时 间 内 解决 。 给 定 基 本 块 的 可 行 分 配 ， 即 在 这 一 分 配 中 每 
一 个 指令 处 ， 对 物理 寄存 器 的 需要 不 超过 物理 寄存 器 的 数量 ， 使 用 一 个 与 区 间 图 着 色 类 似 的 方法 可 以 在 
线性 时 间 内 完成 一 个 赋值 。 一 个 完整 过 程 的 相关 问题 可 以 在 多 项 式 时 间 内 解决 ， 即 如 果 在 每 一 个 指令 处 
对 物理 寄存 器 的 需要 不 超过 物理 寄存 器 的 数量 ， 那 么 编译 器 可 以 在 多 项 式 时 间 内 构造 一 个 赋值 。 

分 配 和 赋值 之 间 的 差异 是 微妙 且 重 要 的 。 在 寻求 改进 寄存 器 分 配器 的 性 能 中 ， 编 译 器 设计 者 必须 弄 
清楚 是 分 配 中 存在 弱点 还 是 赋值 中 存在 弱点 ， 并 直接 在 这 一 算法 的 相应 部 分 下 功夫 。 


13.2.3 寄存 器 分 类 


大 多 数 处 理 器 所 提供 的 物理 寄存 器 不 能 形成 可 互 换 资源 的 同 质地。 大 多 数 处 理 器 对 不 同 种 类 的 值 有 
不 同 的 寄存 器 类 。 

例如 ， 大 多 数 现代 计算 机 既 有 通用 寄存 器 (general-purpose register) 又 有 浮 点 寄存 器 (floating- 
point register)。 前 者 保存 整数 值 和 内 存 地 址 ， 而 后 者 保存 浮 点 值 。 该 二 分 类 法 并 不 新 鲜 ， 早 期 的 IBM360 
机 器 有 16 个 通用 寄存 器 和 4 个 浮 点 寄存 器 。 现 代 处 理 器 可 能 增加 更 多 的 类 。 例 如 ,1BM/Motorola 
PowerPC 有 条件 代码 的 独立 寄存 器 类 ， 而 Intel IA-64 有 谓词 寄存 器 和 分 支 目标 寄存 器 的 附加 类 。 编 译 器 必 
须 把 每 一 个 值 放置 到 适当 类 的 寄存 器 中 。 

如 果 两 个 寄存 器 类 之 间 的 互相 作用 是 受 限 的 ， 那 么 编译 器 也 许 能 够 独立 地 为 它们 分 配 寄存 器 。 这 把 
问题 分 解 成 更 小 且 相 互 独立 的 组 成 部 分 ， 减 小 数据 结构 的 大 小 ， 而 且 可 能 产生 更 快 的 编译 时 间 。 然 而 ， 
当 两 个 寄存 器 类 重 丰 时， 这 两 个 类 都 必须 被 模型 化 为 单一 分 配 问题 。 把 汉 和 精度 浮 点 数 保存 在 一 对 单 精度 
寄存 器 中 ， 这 样 常见 的 体系 结构 实践 就 是 这 一 问题 的 一 个 很 好 的 例子 。 双 精度 值 类 和 单 精度 值 类 都 映射 
到 硬件 寄存 器 的 一 组 相同 的 集合 上 。 在 不 考虑 其 中 一 个 类 的 情况 下 ， 编 译 器 无 法 分 配 另外 一 个 类 ， 所 以 
. 它 必须 解决 这 一 联合 分 配 问题 。 

即使 不 同 的 寄存 器 类 在 物理 上 和 远 辑 上 是 独立 的 ， 它 们 也 通过 引用 多 个 类 中 的 寄存 器 的 操作 而 相互 
作用 。 例 如 ， 对 于 很 多 体系 结构 ， 滋 出 一 个 浮 点 寄存 器 的 决定 要 求 插入 一 个 地 址 计算 和 某 些 内 存 操作 ; 
这 些 动作 使 用 通用 寄存 器 ， 并 改变 那 一 类 寄存 器 的 分 配 问题 。 因 此 ， 编 译 器 可 以 对 不 同 的 类 做 出 相互 独 
立 的 分 配 决定 ， 但 是 这 些 决定 的 结果 可 能 对 其 他 寄存 器 类 的 分 配 产生 影响 。 溢 出 一 个 谓词 寄存 器 或 一 个 
条 件 代码 寄存 器 也 有 类 似 的 效应 。 因 此 ， 通 用 寄存 器 应 该 在 其 他 寄存 器 类 之 后 分 配 。 


13.3 局 部 寄存 器 分 配 和 赋值 


作为 对 寄存 器 分 配 的 介绍 ， 考 虑 为 单一 基本 块 产生 好 分 配 的 过 程 中 出 现 的 问题 。 在 优化 中 ， 处 理 单 
一 基本 块 的 方法 被 称 为 局 部 (local) 方法 ， 所 以 这 些 算法 是 局 部 寄存 器 分 配 技术 。 分 配器 取 带 有 寄存 器 
到 寄存 器 存储 模型 的 单一 基本 块 为 输入 。 

为 了 简化 讨论 ， 我 们 假设 程序 开始 并 结束 于 这 一 块 ; 它 不 从 较 早 执行 的 块 中 继承 值 ， 而 且 从 不 为 较 
晚 执行 的 块 留 下 任何 值 。 我 们 的 输入 程序 将 只 使 用 通用 寄存 器 的 单一 类 。 我 们 的 目标 机 器 将 支持 k 个 通 
用 寄存 器 的 单一 集合 。 

代码 形态 编码 关于 哪些 值 可 以 合法 地 驻 留 于 一 个 寄存 器 一 段 时 间 等 信息 。 可 以 合法 驻 留 在 寄存 器 中 
的 任意 值 被 保存 在 一 个 寄存 器 中 。 代 码 使 用 任意 多 寄存 器 名 字 来 编码 这 一 信息 ， 所 以 它 可 能 命名 比 目 标 
机 器 所 有 的 寄存 器 更 多 的 寄存 器 。 出 于 这 一 原因 ， 我 们 称 这 些 预 分 配 寓 存 器 为 座 拟 穿 存 器 (virtual 
register)。 对 于 一 个 给 定 的 块 ， 它 所 使 用 的 虚拟 寄存 器 的 数量 是 MaxVR。 
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这 一 基本 块 是 由 个 三 地 址 操作 0:、0;、0;、…、oW 的 序列 组 成 的 。 每 一 个 操作 01 都 有 形式 op vr, 
Vr, 二 vr1,。 表 记 法 vr 表明 这 些 是 虚拟 寄存 器 而 不 是 物理 寄存 器 。 从 高 层次 观点 看 ， 局 部 寄存 器 分 配 的 
目标 是 创建 一 个 等 价 块 ， 在 其 中 对 一 个 虚拟 寄存 器 的 每 一 次 引用 都 被 对 一 个 特定 物理 寄存 器 的 引用 所 取 
代 。 如 果 MaxyR >k， 那 么 分 配器 可 能 需要 插入 装 人 和 存储 以 使 代码 适合 :个 物理 寄存 器 的 集合 。 这 一 性 
质 的 另外 一 种 陈述 是 ， 在 块 的 任意 点 ， 输 出 代码 不 能 有 多 于 k 个 值 在 寄存 器 中 。 

我 们 将 给 出 两 个 解决 这 一 问题 的 方法 。 第 一 个 方法 计数 块 中 引用 一 个 值 的 次 数 ， 并 使 用 这 一 频率 计 
数 来 决定 哪些 值 驻 留 在 寄存 器 中 。 因 为 它 依赖 于 频率 计算 这 样 的 额外 获取 的 信息 才能 做 出 决定 ， 我 们 认 
为 这 是 一 个 自 顶 向 下 的 方法 。 第 二 个 方法 依赖 于 代码 的 详细 、 低 层 信息 来 做 出 它 的 决定 。 它 遍历 这 个 块 ， 
并 在 每 一 个 操作 处 决定 是 否 需要 一 个 溢出 。 因 为 它 综 合并 组 合 很 多 低层 事实 来 驱动 做 出 决定 的 过 程 ， 我 
们 认为 这 是 一 个 自 底 向 上 的 方法 。 


13.3.1 自 项 向 下 的 局 部 寄存 器 分 配 


自 顶 向 下 局 部 分 配器 的 工作 基于 一 个 简单 的 原则 : 最 常用 的 值 应 该 驻 留 在 寄存 器 中 。 为 了 实现 这 一 
启发 式 探 索 法 ， 它 计数 这 个 块 中 每 一 个 虚拟 寄存 器 的 出 现 次 数 ， 并 把 这 些 频 率 计数 作为 把 虚拟 寄存 器 分 
配 到 物理 寄存 器 的 优先 度 。 

如 果 虚 拟 寄存 器 比 物理 寄存 器 多 ， 那 么 分 配器 必须 保存 若干 个 物理 寄存 器 以 便 用 于 涉及 分 配 到 内 存 
中 的 值 的 计算 。 分 配器 必须 有 足够 多 的 寄存 器 来 对 两 个 操作 数 寻 址 和 装 入 ， 执 行 这 一 操作 ， 并 存储 其 结 
果 。 所 需要 寄存 器 的 精确 数量 依赖 于 目标 体系 结构 ; 在 典型 的 RISC 机 器 上 ， 这 一 数量 可 以 是 2 ~ 4 个 寄 
存 器 。 我 们 将 称 这 一 机 器 特定 数 为 可 行 (feasible) 值 。 

为 了 执行 自 顶 向 下 局 部 分 配 ， 编 译 器 可 以 运用 如 下 简单 的 算法 : . 

1) 为 每 一 个 虚拟 寄存 器 计算 优先 度 。 线 性 遍历 这 个 块 中 的 操作 ， 分 配器 可 以 记录 每 一 个 虚拟 寄存 
器 出 现 的 次 数 。 虚 拟 寄存 器 的 计数 值 就 是 它 的 优先 度 。 

2) 将 虚拟 寄存器 按 优 先 度 顺 序 分 类 。 如 果 块 适当 地 小 ， 那 么 它 可 以 使 用 一 个 桶 分 类 ， 因 为 这 样 的 
计数 必 将 落 到 一 个 小 范围 之 内 ， 也 就 是 零 到 块 长 度 的 一 个 小 倍数 之 间 。 i 

3) 按 优先 度 顺 序 指定 寄存 器 。 前 上 个 可 行 虚 拟 寄 存 器 被 指定 给 物理 寄存 器 。 

4) 重 写 代码 。 在 第 二 次 遍历 代码 中 ， 分 配器 可 以 重 写 代 码 。 对 赋值 给 物理 寄存 器 的 虚拟 寄存 器 的 
引用 ， 用 物理 寄存 器 名 字 进 行 重 写 。 对 任意 没有 赋值 给 物理 寄存 器 的 虚拟 寄存 器 的 引用 ， 使 用 对 一 个 已 
保存 的 临时 寄存 器 的 引用 取代 它 ; 并 适当 地 播 和 一 个 装 和 操作 或 一 个 存储 操作 。 

这 一 方法 的 优点 是 它 把 常用 的 虚拟 寄存 器 保存 在 物理 寄存 器 中 。 它 的 主要 弱点 在 于 分 配 的 方法 : 贯 
穿 整个 基本 块 ， 它 给 一 个 虚拟 寄存 器 指定 一 个 物理 寄存 器 。 因 此 ， 在 这 个 块 的 前 半 部 分 频繁 使 用 但 在 其 
后 半 部 分 不 复 用 的 值 ， 在 整个 后 半 部 分 仍然 占据 着 物理 寄存 器 ， 即 使 已 不 复 用 它 。 下 一 节 给 出 解决 这 一 
问题 的 技术 。 它 采用 根本 上 不 同 的 方法 来 分 配 : 一 个 自 底 向 上 、 递 增 的 分 配方 法 。 


13.3.2 自 底 向 上 的 局 部 寄存 器 分 配 


自 底 向 上 局 部 寄存 器 分 配器 背后 的 关键 思想 是 : 集中 考虑 在 每 一 个 操作 执行 时 所 出 现 的 转换 。 它 开 
始 于 所 有 寄存 器 都 不 被 占据 。 对 于 每 一 个 操作 ， 分 配器 需要 保证 这 一 操作 的 操作 数 在 其 执行 之 前 在 寄存 
器 中 。 它 还 必须 给 这 一 操作 的 结果 分 配 一 个 寄存 器 。 图 13-1 给 出 分 配器 的 基本 结构 以 及 它 所 使 用 的 三 个 
支持 例 程 。 

这 一 自 底 向 上 分 配器 在 块 内 的 操作 上 迭代 ， 按 需求 进行 分 配 决策 。 然 而 ， 却 存在 某 些微 妙 的 地 方 。 
通过 依次 考虑 vr' 和 vr,,， 分 配器 避免 为 诸如 add r,, ry 一 r, 这 样 的 带 有 重复 操作 数 的 操作 使 用 两 个 物理 
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寄存 器 。 同 样 地 ， 在 分 配 r: 之 前 尝试 释放 rx 和 ry， 避 免 当 这 一 操作 实际 上 释放 一 个 寄存 器 时 溢出 一 个 寄 
存 器 来 保存 结果 。 大 多 复杂 性 都 被 隐藏 于 例 程 Ensure、4711ocate 和 Free 之 中 。 


/* code for the allocator */ 
for each operation, i, in order from 1 
to N where i has the form 
Op Wri, VTi, > Vg 
fx + ensure(vr;,, cass (vr )) 
fy + ensure (vri, dass(vr;,)) 
if yri, is not needed after i 
then free(r,,class(r,)) 
if vra, is not needed after i 
then free(t,,class(r,)) 
rz allocate (vriy class ( vri;)) 
rewrite i GS Opi Ty Ty => rz 
if vr, is needed after i 
then class.Next[r,] + dist(vr;,) 
if vrs, is needed after i 
then class.Next[r,] — dist(vri 2) 
class.Next[r:] + dist(vri,) 


free(i,class) 
if (class.Freefi] # true) then 
push(iclass) 
class.Namefi] +- —1 
class.Next{i] — oo 
class.Freefi] + true 





ensure(vr,class) 
if (vr is already in class) 
then result +- vr's physical register 


else 
result + allocate(vr,class) 
emit code to move vr into result 


return result 


allocate(vr,class) 

if (class.StackTop > 0) 
then i + pop(class) 

else 
i + j that maximizes class.Next{j] 
store contents of j 

class.Namefi] — vr 

class.Next[i] — —1 

class.Freefi] + false 

return i 





图 13-1 自 底 向 上 局 部 寄存 器 分 配器 


例 程 Ensure 在 概念 上 是 简单 的 。 它 取 两 个 参数 ， 一 个 保存 理想 值 的 虚拟 寄存 器 Vr 和 一 个 适当 寄存 器 
类 的 表示 class。 如 果 Yr 已 经 占据 一 个 物理 寄存 器 ， 那 么 Ensure 的 工作 已 经 结束 。 否 则 ， 它 要 为 Vr 分 配 一 
个 物理 寄存 器 并 发 行 把 vr 的 值 移 到 那个 物理 寄存 器 中 的 代码 。 无 论 哪 种 情况 ， 它 返回 一 个 物理 寄存 器 。 

Allocate 和 Free 揭 示 分 配 问题 的 细节 。 为 了 理解 这 两 个 例 程 ， 我 们 需要 寄存 器 类 的 一 个 具体 表示 : 
如 图 13-2 左 边 所 示 用 C 语 言 所 写 的 代码 。 一 个 类 有 Size 个 物理 寄存 器 ， 每 一 个 都 用 虚拟 寄存 器 名 字 表 示 
(Name) ; 整数 Next 表 示 到 这 一 虚拟 寄存 器 的 下 一 次 使 用 的 距离 ， 标 记 Free 表 示 这 一 物理 寄存 器 当前 是 
否 在 使 用 中 。 此 图 右边 所 示 的 代码 初始 化 这 个 类 的 结构 ， 使 用 - 1 作为 超出 范围 名 字 ， 使 用 = 作为 最 大 
可 能 距离 。 为 使 41 1ocate 和 Free 高 效 ， 这 个 类 还 需要 一 个 自由 寄存 器 的 列表 ， 这 是 C1ass 中 的 Stack。 
例 程 push 和 pop 操 纵 Stack。 l 


initialize(class,size) 
class. Size + size 


struct Class { 
int Size; 
int Name[Size] ; 
int Next[Size]; 
int Free[Size] ; 
int Stack[Size] ; 
int StackTop; 


>class.StackTop +- —1 
fori — Oto size—1 


class.Namef[i] — —1 
class.Next[i] <— co 
class.Freefi] +- true 
push(i.class) 





图 13-2 用 C 语 言 表 示 寄 存 器 类 
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使 用 这 一 细节 层次 ，411ocate 和 Free 的 代码 就 是 直截了当 的 。 每 一 个 类 维护 自由 物理 寄存 器 的 一 个 
栈 。 当 class 的 自由 列表 中 存在 自由 的 物理 寄存 器 时 ，A1locate 从 该 列表 返回 一 个 物理 寄存 器 。 否 则 ， 
它 选择 c71ass 中 后 面 最 远 使 用 的 值 ， 存 储 这 个 值 ， 并 为 vr 重新 分 配 这 一 物理 寄存 器 。 分 配 设置 Next 域 为 
-1， 保 证 不 为 当前 操作 的 其 他 操作 数 选择 这 一 寄存 器 。 分 配器 的 主 循环 在 完成 当前 操作 后 ， 将 把 它 的 
Next 域 重新 设置 为 适当 的 值 。Free 把 寄存 器 压 人 stack， 并 重新 设置 它 在 c1ass 结 构 中 的 域 。 

销 数 dist(vr) 返回 对 vr 的 下 一 次 引用 在 这 一 块 中 的 索引 。 编 译 器 可 以 通过 在 这 一 块 上 做 一 次 向 后 
遍历 来 使 用 适当 和 的 dist 值 注释 块 中 的 每 一 个 引用 。 

这 一 自 底 向 上 技术 的 纯 效应 是 直截了当 的 。 最 初 ， 它 假设 物理 寄存 器 没有 被 占据 ， 并 把 它们 放置 在 
自由 列表 上 。 对 于 前 几 个 操作 ， 它 满足 从 自由 列表 分 配 物 理 寄存 器 的 请 求 。 当 分 配器 需要 另 一 个 寄存 器 
并 发 现 自由 列表 为 空 时 ， 它 必须 从 寄存 器 中 溢出 一 个 值 到 内 存 中 。 它 挑选 出 下 一 次 使 用 在 后 面 最 远 的 值 。 
只 要 溢出 一 个 值 的 代价 对 所 有 寄存 器 都 是 相同 的 ， 那 么 这 一 选择 释放 空置 时 期 最 长 的 寄存 器 。 在 某 种 意 
义 上 ， 它 最 大 化 因 溢 出 代价 而 得 到 的 效益 。 

在 实践 中 ， 这 一 算法 产生 优秀 的 局 部 分 配 。 的 确 ， 有 些 设 计 者 认为 它 产生 最 优 分 配 。 然 而 ， 在 实践 
中 也 引发 一 些 复杂 性 。 在 分 配 的 任意 点 处 ， 寄 存 器 中 的 某 些 值 可 能 因 溢 出 而 需要 存储 ， 而 另外 一 些 值 则 
不 需要 。 例 如 ， 如 果 寄 存 器 包含 一 个 已 知 的 常量 值 ， 那 么 这 一 存储 将 是 多 余 的 ， 因 为 分 配器 无 需 内 存 中 
的 一 个 找 贝 就 可 重新 创建 这 个 值 。 同 样 地 ， 由 从 内 存 的 装 入 所 生成 的 值 无需 存 储 。 无 需 存储 的 值 称 为 干 
净 (clean )， 而 需要 存储 的 值 称 为 不 净 (dirty). 

为 了 选择 最 优 的 局 部 分 配 ， 分 配器 必须 考虑 溢出 干净 值 和 溢出 不 净值 在 成 本 上 的 差异 。 例 如 ， 考 虑 
两 寄存 器 机 器 上 的 分 配 ， 在 这 里 值 x, 和 Xs 已 经 在 寄存 器 中 。 假 设 x1 是 干净 值 而 xs 是 不 净值 。 如 果 这 个 块 
剩余 部 分 的 引用 串 是 xsxix:z， 那 么 分 配器 必须 溢出 xi 或 xz 中 的 一 个 。 因 为 xz 的 下 一 次 使 用 在 后 面 更 远 处 ， 
所 以 自 底 向 上 局 部 算法 将 溢出 它 ， 产 生 如 下 图 左边 所 示 的 内 存 操作 序列 。 

store x2 

load x3 load x3 ( 重 写 x1) 


load x2 load x; 


溢出 不 净值 溢出 干净 值 


相反 ， 如 果 分 配器 溢出 x: ， 它 将 产生 上 图 中 右边 所 示 的 内 存 操 作 序列 ， 它 少 一 个 内 存 操 作 。 这 一 情 
况 表 明 ， 分 配器 应 该 优先 溢出 干净 值 而 非 不 净值 。 答 案 却 不 是 这 样 简单 。 

考虑 相同 初始 条 件 下 的 另 一 个 引用 串 xsxixsxixz。 持 续 溢出 干净 值 可 以 产生 下 图 左边 所 示 的 四 内 存 操 
作 序 列 。 

load x3 

load xı store xz 

load x3 load x3 


load x; load Xe 


溢出 干净 值 溢出 不 净值 


相反 ， 持 续 溢 出 不 净值 将 产生 上 图 右边 所 示 的 序列 ， 这 一 序列 至 少 需 要 一 个 内 存 操作 。 考 虑 干净 值 
和 不 净值 之 间 的 差异 使 局 部 分 配 问题 成 为 NP 完全 问题 。 然 而 ， 在 实践 中 ， 自 底 向 上 局 部 分 配器 产生 好 
的 局 部 分 配 ; 它们 往往 比 前 面 所 描述 的 自 顶 向 下 分 配器 产生 更 好 的 局 部 分 配 。 

自 底 向 上 局 部 分 配器 在 处 理 各 个 值 的 方式 上 不 同 于 自 顶 向 下 局 部 分 配器 。 自 顶 向 下 分 配器 在 整个 块 
把 物理 寄存 器 分 配给 虚拟 寄存 器 ， 而 自 底 向 上 分 配器 则 把 物理 寄存 器 只 在 虚拟 寄存 器 的 两 个 连续 引用 之 
间 指 定 给 这 一 虚拟 寄存 器 。 它 在 对 411ocate 的 每 一 次 调用 重新 考虑 所 做 出 的 决定 ， 即 在 每 一 次 需要 另 一 
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个 寄存 器 时 重新 考虑 。 因 此 ， 自 底 向 上 算法 能 够 而 且 的 确 产 生 一 个 这 样 的 分 配 : 其 中 单一 虚拟 寄存 器 在 
其 生存 期 的 不 同 点 保存 在 不 同 的 物理 寄存 器 中 。 也 可 以 为 自 顶 向 下 分 配器 制定 类 似 的 行为 。 


13.4 移 到 超出 单一 块 的 范围 


我 们 已 经 看 到 如 何 为 单一 块 构建 好 的 分 配器 。 以 自 顶 向 下 的 方式 ， 我 们 得 到 频率 计数 分 配器 。 以 自 
底下 上 的 方式 ， 我 们 得 到 自 底 向 上 局 部 分 配器 。 我 们 可 以 利用 自 底 向 上 局 部 算法 所 得 到 的 经 验 改 进 频率 
计数 分 配器 。 然而， 局 部 分 配 不 能 捕获 跨越 风 个 块 间 的 值 的 复 用 。 在 实践 中 ， 这 一 情况 经 常 出 现 。 因 此 ， 
下 一 步 是 把 分 配 的 作用 域 扩展 到 超过 单一 基本 块 的 范围 。 

遗憾 的 是 ， 从 单一 块 到 多 个 块 的 移动 增加 了 复杂 性 。 例 如 ， 我 们 的 局 部 分 配器 隐 式 假设 值 不 能 在 块 
间 流 动 。 移 动 到 更 大 分 配 作用 域 的 主要 原因 是 : 要 考虑 块 间 的 值 流向 并 生成 高 效 处 理 这 样 的 流动 的 分 配 。 
分 配器 必须 正确 地 处 理 在 前 面 的 块 中 计算 的 值 ， 而 且 它 必须 保存 下 一 个 块 中 使 用 的 值 。 为 了 完成 这 一 任 
务 ， 与 局 部 分 配器 相 比 ， 分 配器 需要 更 加 复杂 的 处 理 “ 值 ”的 方法 。 


13.4.1 活性 和 存活 范围 


区 域 和 全 局 分 配器 都 试图 以 协调 跨越 多 个 块 的 值 的 使 用 的 方式 把 值 指定 给 寄存 器 。 这 些 分 配器 依据 
反映 定义 的 真实 模式 以 及 每 个 值 的 使 用 的 新 名 字 空间 来 工作 。 它 们 不 是 把 变量 或 值 分 配给 寄存 器 ， 而 是 
分 配 存 活 范围 (live range)。 单 一 存活 范围 由 一 组 彼此 相关 的 定义 和 使 用 组 成 ， 因 为 它们 的 值 一 起 流动 。 
也 就 是 说 ， 一 个 存活 范围 包含 一 个 定义 的 集合 和 一 个 使 用 的 集合 。 这 一 集合 在 下 面 的 意义 下 是 自 含 的 : 
能 够 达到 一 个 使 用 的 每 一 个 定义 与 这 个 使 用 在 相同 的 存活 范围 内 ， 而 且 一 个 定义 能 够 达到 的 每 一 个 使 用 
与 这 个 定义 在 相同 的 存活 范围 内 。 

术语 存活 范围 隐 式 依赖 于 活性 (liveness) 的 概念 ， 正 如 9.2.1 节 中 对 活 变量 问题 的 讨论 所 解释 的 
那样 。 回 想 一 下 ， 一 个 变量 v 在 点 p 是 活 的 (live)， 如 果 它 沿 着 从 这 一 过 程 的 入 口 到 p 的 路 径 中 被 定义 ， 
而 且 存 在 一 条 从 p 到 v 的 使 用 的 路 径 ， 在 这 一 路 径 上 v 不 被 重 定义 。 在 v 存 活 的 任意 地 点 ， 它 的 值 必须 被 
保留 ， 因 为 后 继 执 行 可 能 使 用 v。 请 记 住 ,v 既 可 能 是 源 程序 的 一 个 变量 ， 也 可 能 是 编译 器 生成 的 临时 
名 字 。 

存活 范围 的 集合 不 同 于 变量 集合 和 值 的 集合 。 代 码 中 计算 的 每 一 个 值 都 是 某 个 存活 范围 的 部 分 ， 即 
使 它 在 原来 的 源 代 码 中 没有 名 字 。 因 此 ， 由 寻 址 计算 而 产生 的 中 间 结 果 有 存活 范围 ， 程 序 员 命 名 的 变量 、 
数组 元 素 以 及 用 作 分 支 目标 为 使 用 装 入 的 地 址 也 是 如 此 。 一 个 特定 程序 员 命名 变量 可 能 有 多 个 不 同 的 存 
活 范围 。 使 用 存活 范围 的 寄存 器 分 配器 ， 可 以 把 这 些 不 同 的 存活 范围 放 到 不 同 的 寄存 器 中 。 因 此 ， 源 语 
言 变量 在 不 同 点 处 可 能 驻 留 在 执行 程序 中 的 不 同 的 寄存 器 中 。 

为 了 使 这 些 思想 更 具体 ， 考 虑 在 单一 基本 块 内 寻找 存活 范围 的 问题 。 图 13-3 给 出 图 1-3 的 块 。 我 们 加 
入 了 一 个 初始 操作 来 定义 rsr。。 图 13-3 的 右边 所 示 的 表格 给 出 这 个 块 中 的 不 同 存活 范围 。 在 直线 代码 中 ， 
我 们 可 以 把 一 个 存活 范围 表示 成 一 个 区 间 。 注 意 ， 每 一 个 操作 定义 一 个 值 ， 因 此 它 开始 一 个 存活 范围 。 
考虑 raw。 它 是 在 操作 1 定义 的 。 对 rar 的 每 一 个 其 他 引用 都 是 一 个 使 用 。 因 此 ， 这 个 块 只 使 用 rar 的 一 个 
值 。 区 间 [1，11] 表 示 这 一 存活 范围 。 

相反 ,rw 有 若干 个 存活 范围 。 操 作 2 定义 rw， 操 作 7 使 用 操作 2 定义 的 值 。 操 作 7、8、9 和 10 中 的 每 一 
个 都 定义 一 个 新 的 r, 值 ; 对 于 每 一 种 情况 ， 后 面 的 操作 使 用 新 定义 的 值 。 因 此 ， 图 中 命名 为 rv 的 寄存 器 
对 应 于 5 个 不 同 的 存活 范围 : [2，7]、[7，8]、[8，9]、[9，10] 和 [10，11]。 寄 存 器 分 配器 无 需 在 同一 个 
物理 寄存 器 中 保存 这 些 不 同 的 存活 范围 。 相 反 ， 它 可 以 把 块 中 的 每 一 个 存活 范围 作为 独立 的 值 来 分 配 和 
赋值 。 


an 
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loadl --- => Tarp 


loadAI Tarp» 0 => ru = [1,11] 


loadI 2 => rz [2,7] 
loadAI Tarp, @x > rx [7,8] 
loadAI Tarp, @y > ry [8,9] 
loadAI Tarp, @z > rz [9,10] 
mult: tw To > Ty [10,11] 
mult rn,r => Tw [3,7] 
mult mm => Tw P [4,8] 
"mit tit sr [5,9] 
storeAl ry => Tarp» 0 ~ (6,10) 





图 13-3 基本 模块 中 的 存活 范围 


为 了 在 比 单一 块 大 的 区 域内 寻找 存活 范围 ， 编 译 器 必须 执行 活 变量 分 析 ， 以 发 现在 每 一 块 的 出 口 是 
活着 的 值 的 集合 。 它 可 以 使 用 得 自 于 这 一 分 析 的 集合 LIVEOUT(D) 以 及 包含 在 通 向 的 入 口 是 活 着 的 变 
量 的 集合 LIVEIN(b) 来 注释 每 一 个 块 b。 而 LIVEIN(b) 恰好 是 UEVAR(b)U (LIVEOUT(b) nN 
VARKILL(b) ). 

在 代码 的 任意 一 点 ， 不 是 活着 的 值 不 需要 寄存 器 。 同 样 地 ， 只 有 在 点 p 需 要 寄存 器 的 那些 值 才 是 在 
点 p 活 着 的 值 ， 或 是 这 些 活着 的 值 的 某 个 子 集 。 真 实 编译 器 中 实现 的 局 部 寄存 器 分 配器 使 用 LIVEOUT 集 
合 来 决定 何 时 一 个 值 必须 在 它 在 一 个 块 的 最 后 使 用 之 前 被 保存 在 内 存 中 。 全 局 分 配器 使 用 类 似 的 信息 来 
发 现存 活 范围 并 引导 分 配 过 程 。 


13.4.2 块 边 界 处 的 复杂 性 


使 用 局 部 寄存 器 分 配 的 编译 器 也 许 要 为 每 一 个 块 计算 LIVEIN 和 LIVEOUT， 来 作为 向 局 部 分 配器 提 
供 有 关 这 一 块 的 入 口 和 出 口 的 值 的 状态 信息 的 必要 前 奏 。 当 控制 流 从 一 个 块 流向 另 一 个 块 时 ， 这 些 集 合 


”的 存在 简化 使 各 个 块 的 分 配 正 确 行动 的 任务 。 例 如 ，LIVEOUT(b) 中 的 值 在 它 在 b 中 的 最 后 一 次 定义 之 


后 必须 存储 于 内 存 中 ， 以 确保 当 这 个 值 在 后 继 块 中 被 装 入 时 ， 它 将 处 于 期 望 的 位 置 上 。 相 反 ， 如 果 这 个 
值 不 在 LIVEOUT(b) 中 ， 那 么 它 无 需 存 储 ， 除 非 是 作为 5 内 部 后 来 使 用 的 一 个 溢出 。 

由 于 考虑 多 个 块 而 引入 的 某 些 效应 复杂 化 赋值 或 分 配 ， 或 者 同时 使 二 者 复杂 化 。 图 13-4 给 出 出 现 于 
全 局 赋值 中 的 某 些 复杂 性 。 考 虚 沿 从 块 B, 到 B, 的 边 上 发 生 的 转换 。 


storeAI r3 = Tarps @x 











Bı B2 





storeAl ry = rarp, @x 










B3 





loadAI Tarp, @x => rz B4 


loadAI Tarp, @x => ra 


图 13-4 多 个 块 中 存在 的 问题 


B, 在 r; 中 有 程序 变量 x 的 值 。B, 在 rs 中 需要 它 。 当 局 部 分 配器 处 理 BI 时 ， 它 没有 其 他 块 所 创建 的 上 下 
文 信息 ， 所 以 它 必须 把 x 存储 回 x 在 内 存 中 的 位 置 ( 在 ?ro 中 距 ARP 偏 移 为 ex 的 位 置 )。 同 样 地 ， 当 分 配器 
处 理 B; 时 ， 它 没有 关于 B 的 行为 信息 ， 所 以 它 必 须 从 内 存 装 入 x。 当 然 ， 如 果 它 知道 Bi 上 的 分 配 结果 ， 
那么 它 可 以 把 x 赋 给 r; 并 且 使 这 一 装 入 不 再 必要 。 在 缺乏 这 方面 的 信息 时 ， 它 必须 生成 这 一 装 入 。 在 和 
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Bs 中 对 x 的 引用 进一步 复杂 化 这 一 问题 。 在 块 间 协 调 x 的 赋值 的 任意 企图 都 必须 考虑 这 两 个 块 ， 因 为 B, 是 
Bi 的 后 继 ， 而 且 在 B 中 对 x 的 处 理 的 任何 变化 都 将 对 它 的 另 一 个 前 虹 B, 产 生 影 响 。 
分 配 也 引发 类 似 的 效应 。 如 果 Xx 在 Bs, 中 不 被 引用 将 如 何 昵 ? 即 使 我 们 可 以 全 局 地 协调 斌 值 ， 保 证 使 


”用 x 时 它 总 是 在 r; 中 ， 分 配器 还 是 需要 在 B, 的 末端 插 人 x 的 一 个 装 人 ， 使 得 B, 避 开 对 x 的 初始 装 人 。 当 然 ， 


如 果 B, 有 其 他 后 继 ， 那 么 它们 可 能 不 引用 x， 而 需要 ry 中 的 另外 一 个 值 。 

块 边界 处 的 这 些 效应 可 以 变 得 越发 复杂 。 它 们 不 适合 局 部 分 配器 ， 因 为 它们 处 理 完全 在 局 部 分 配器 
作用 域 之 外 的 现象 。 如 果 分 配器 设法 插入 几 个 额外 的 指令 来 消除 这 一 差异 ， 那 么 它 可 能 选择 在 错误 的 块 
中 插入 它们 。 例 如 ， 在 一 个 形成 内 部 循环 体 的 块 中 ， 而 不 是 在 那个 循环 的 头 部 块 中 插入 它们 。 局 部 模型 
假设 所 有 指令 以 相同 的 频率 执行 ;拓宽 这 一 模型 处 理 更 大 区 域 也 使 这 一 假设 无 效 。 好 坏 分 配 之 间 的 差异 
可 能 在 于 代码 中 最 经 常 执行 块 中 的 几 个 指令 。 

当 我 们 设法 把 局 部 分 配 范例 拓宽 到 超出 单一 块 的 范围 了 时， 引发 第 二 个 更 微妙 、 更 令 人 困惑 的 问题 。 
考 虚 在 块 B, 上 使 用 自 底 向 上 局 部 算法 。 仅 使 用 一 个 块 时 , “最 远 的 ”下 一 次 引用 的 概念 很 清晰 。 局 部 算 
法 对 每 一 个 下 一 次 引用 有 惟一 的 距离 。 对 于 多 后 继 块 ， 分 配器 必须 考虑 沿 着 所 有 离开 已 的 路 径 的 引用 。 
对 于 Bi 中 的 某 个 值 y 的 最 后 引用 ， 下 一 次 引用 或 者 是 B; 中 对 y 的 第 一 次 引用 ， 或 者 是 8 中 对 y 的 第 一 次 引 
用 。 这 两 次 引用 很 少 会 在 相对 于 B, 的 尾部 相间 的 地 方 。 另 外 ，Bs 可 能 不 包含 对 y 的 引用 ， 而 Bs 却 包含 一 
个 这 样 的 引用 。 即 使 两 个 模块 都 使 用 y， 而 且 引 用 是 在 输入 代码 中 距离 相同 的 地 方 发 生 的 ， 在 一 个 块 中 
的 局 部 溢出 也 可 能 使 它们 以 某 种 不 可 预测 的 方式 产生 差异 。 当 构成 自 底 向 上 局 部 方法 的 基本 度量 变 成 多 
值 时 ， 算 法 的 效应 变 得 更 难 理解 、 更 难 证 实 。 

所 有 这 些 问题 表明 ， 我 们 需要 一 个 全 新 的 方法 来 把 局 部 分 配 转换 到 区 域 分 配 或 全 局 分 配 。 的 确 ， 成 
功 的 全 局 分 配 算法 与 局 部 分 配 算法 很 少 有 相似 之 处 。 


13.5 全 局 寄存 器 分 配 和 赋值 


寄存 器 分 配器 的 目标 是 最 小 化 它 必 须 插 入 的 指令 所 需 的 执行 时 间 。 分 配器 不 能 保证 为 这 一 问题 提供 
最 优 解 。 从 执行 时 间 的 角度 看 ， 同 一 基础 代码 的 不 同 分 配 的 差异 在 于 分 配器 插入 的 装 入 、 存 储 和 拷贝 操 
作 的 数量 的 不 同 ， 以 及 它们 在 代码 中 的 放置 不 同 。 因 为 不 同 的 块 执行 的 次 数 不 同 ， 所 以 溢出 的 放置 对 执 
行 溢 出 代码 所 需 的 时 间 总 量 产生 强烈 的 影响 。 因 为 块 执行 频率 随 运行 而 发 生变 化 ， 最 佳 分 配 的 概念 在 某 
种 程度 是 空洞 的 ， 它 必须 以 执行 频率 的 特定 集合 为 条 件 。 

全 局 分 配 在 以 下 两 个 基本 方面 不 同 于 局 部 分 配 。 i 

1) 存活 范围 的 结构 比 局 部 分 配器 中 的 结构 更 复杂 。 在 单一 块 中 ， 存 活 范围 只 是 线性 操作 串 中 的 一 
个 区 间 。 在 全 局 分 配器 中 寻找 存活 范围 更 加 复杂 。 一 个 全 局 存活 范围 是 由 定义 和 使 用 这 两 个 关系 的 闭 包 
所 建立 的 定义 和 使 用 的 网 络 。 对 于 存活 范围 内 的 每 一 个 使 用 ， 它 包含 能 够 达到 那个 使 用 的 每 一 个 定义 。 
对 于 活 范围 内 的 每 一 个 定义 ， 它 包含 那个 定义 能 达到 的 每 一 个 使 用 。 

2) 对 于 同一 变量 的 不 同 引 用 执行 的 次 数 可 能 不 同 。 在 单一 块 中 ， 如 果 任 意 操 作 执 行 ， 那 么 所 有 操 
作 都 执行 (除非 出 现 异 常 )， 所 以 溢出 的 代价 是 一 致 的 。 在 更 大 的 作用 域内 ， 每 一 个 引用 可 能 处 于 不 同 
的 块 中 ， 所 以 溢出 的 代价 取决 于 引用 的 位 置 。 当 全 局 分 配器 必须 溢出 时 ， 它 应 该 考虑 成 为 溢出 候选 的 每 
一 个 存活 范围 的 溢出 代价 。 

任意 全 局 分 配器 必须 处 理 这 两 个 问题 。 这 使 全 局 分 配 着 实 比 局 部 分 配 更 复杂 。 
| 为 了 处 理 复杂 的 存活 范围 问题 ， 全 局 分 配器 显 式 创建 一 个 名 字 空间 ， 在 这 一 空间 内 每 一 个 不 同 的 存 
活 范 围 有 不 同 的 名 字 。 然 后 ， 分 配器 把 一 个 存活 范围 映射 到 一 个 物理 寄存 器 或 内 存 位 置 上 。 为 了 实现 这 
一 点 ， 全 局 分 配器 首先 构建 存活 范围 并 重 命名 代码 中 所 有 虚拟 寄存 器 引用 ， 以 反映 已 构建 存活 范围 的 新 
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名 字 空 间 。 为 了 处 理 执行 频率 问题 ， 分 配器 可 以 使 用 一 个 评估 执行 频率 来 注释 每 一 个 引用 或 每 一 个 基本 
块 。 这 一 评估 可 能 来 自 于 静态 分 析 ， 或 来 自 于 程序 的 实际 执行 期 间 所 收集 的 侧面 数据 。 这 个 评估 执行 频 
率 被 用 于 引导 分 配器 来 做 出 关于 分 配 和 溢出 的 决策 。 

最 后 , 爹 局 分 配器 必须 做 出 关于 分 配 和 赋值 的 决策 。 它 们 必须 决定 哪些 存活 范围 将 驻 留 在 寄存 器 中 。 
它们 必须 决定 两 个 存活 范围 是 否 可 以 共享 一 个 寄存 器 。 它 们 必须 把 特定 物理 寄存 器 赋 给 被 分 配 的 每 一 个 
存活 范围 。 

很 多 全 局 分 配器 使 用 图 着 色 范 例 。 它 们 构建 一 个 图 来 模型 化 存活 范围 间 的 冲突 ， 并 为 这 个 图 寻找 适 
当 的 着 色 。 着 色 被 用 于 模型 化 寄存 器 赋值 ; 它 使 分 配器 知道 什么 时 候 两 个 值 不 能 共享 一 个 寄存 器 。 不 同 
的 着 色 分 配器 以 不 同 的 方法 处 理 分 配 (或 溢出 )。 我 们 将 审视 使 用 高 级 信息 做 出 分 配 决策 的 自 顶 向 下 分 
配器 ， 以 及 使 用 低级 信息 做 出 那些 决策 的 自 底 向 上 分 配器 。 然 而 ， 在 考虑 这 两 个 方法 之 前 ， 我 们 揭示 分 

SHAN RAKE: 发 现存 活 范 围 、 估 测 溢出 代价 及 构建 冲突 图 。 


很 多 全 局 分 寄存 器 分 配器 使 用 图 着 色 (graph coloring) 作为 范例 模型 化 基本 分 配 问题 。 对 于 任 | 
意 的 图 C，G 的 一 个 着 色 给 G 中 的 每 一 个 结 点 指定 一 种 颜色 ， 使 得 相 邻 结 点 对 没有 相同 颜色 。 使 用 上 | 
种 颜色 的 -- 种 着 色 称 为 一 个 k 着 色 ， 而 且 对 于 给 定 图 的 这 样 的 最 小 的 上 称 为 这 个 图 的 着 色 数 
(chromatic number ) 。 考 虑 下 面 的 图 : | 
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左 侧 的 图 是 2 着 色 的 。 例 如 ， 给 结 点 1 和 5 指定 益 色 ,给 结 点 x、3 和 4 指定 红色 产生 所 需 的 结果 。 增 加 | 
结 点 2 和 结 点 3 之 间 的 边 ， 如 右 图 所 示 使 此 图 成 为 3 着 色 ， 而 不 是 2 着 色 。( 给 结 点 1 和 结 点 5 指定 蔓 色 ，| 
结 点 2 和 结 点 3 指定 红色 ， 给 结 点 3 指定 白色 。) 

对 于 一 个 给 定 图 ， 寻 找 它 的 着 色 数 问题 是 NP 完全 的 。 类 似 地 ， 对 于 某 个 固定 的 :， 确 定 一 个 图 | 
是 着色 的 问题 是 NP 完全 的 。 使 用 图 着 色 作为 分 配 资源 范例 的 算法 利用 近似 方法 来 寻找 适合 可 用 资 | 





13.5.1 发 现 全 局 存活 范围 


为 了 构建 存活 范围 ， 编 译 器 必须 发 现 不 同 定 义 和 使 用 之 间 存 在 的 关系 。 分 配器 必须 得 到 一 个 名 字 空 
闻 ， 这 一 空间 必须 是 集成 达到 单一 使 用 的 所 有 定义 以 及 单一 定义 所 达到 的 所 有 使 用 的 单一 名 字 空 间 。 这 
提出 一 个 方法 ， 使 用 这 一 方法 编译 器 给 每 一 个 定义 指定 一 个 不 同 的 名 字 并 把 达到 一 个 公共 使 用 的 名 字 合 
并 到 一 起 。 

代码 的 SSA 形 式 给 出 这 一 构造 法 的 一 个 自然 的 开始 点 。 回 想 一 下 ， 在 SSA 形 式 中 ， 每 一 个 名 字 只 被 
定义 一 次 ， 每 一 个 使 用 只 引用 一 个 定义 。 为 协调 这 两 个 规则 插入 的 $ 函 数 记 录 在 控制 流 图 中 不 同 的 路 径 
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上 的 不 同 定义 达到 一 个 引用 的 事实 。 流 向 一 个 9 函数 的 两 个 或 多 个 定义 属于 同一 个 存活 范围 ， 因 为 函数 


创建 一 个 代表 所 有 值 的 名 字 。 引 用 % 函 数 结果 的 任意 操作 使 用 其 中 的 一 个 值 ; 这 个 值 依赖 于 控制 流 如 何 


达到 这 一 9 函数 。 因 为 可 以 通过 相同 的 使 用 引用 所 有 定义 ， 所 以 这 些 定义 必须 驻 留 在 相同 的 寄存 器 中 。 
因此 ，y 函 数 是 构建 SSA 形 式 的 代码 的 存活 范围 的 关键 。 

为 了 从 SSA 形 式 构建 存活 范围 ， 分 配器 使 用 不 相交 集合 的 并 集 寻 找 算法 ， 并 在 代码 之 上 做 一 次 遍历 。 
分 配器 把 每 一 个 SSA 名 字 或 定义 作为 算法 中 的 一 个 集合 来 处 理 。 分 配器 检查 程序 中 的 每 一 个 8 函数 ， 并 
把 与 每 一 个 9 函数 参数 相关 的 集合 与 9 函数 目标 的 集合 合并 起 来 。 当 所 有 这 些 % 函 数 已 被 处 理 过 后 ， 其 结 
果 集 合 代表 代码 中 的 存活 范围 。 此 时 ， 分 配器 可 以 或 者 重 写 使 用 存活 范围 名 字 的 代码 ， 或 者 创建 并 维护 
SSA 名 字 与 存活 范围 之 间 的 一 个 映射 。 

图 13-5 左 侧 给 出 包含 源 代码 变量 a、b、c 和 d 的 半 剪 枝 SSA 形 式 中 的 一 个 代码 片段 。 为 了 寻找 存活 范 
围 ， 分 配器 给 每 一 个 SSA 名 字 指 定 一 个 包含 这 个 名 字 的 集合 。 它 合并 与 在 9 函数 中 使 用 的 名 字 相 关 的 集 
Æ, {d} U {di} U {d。}。 其 结果 给 出 四 个 存活 范围 的 集合 : LRE a), LES b), LES icf 
LR 包含 {do。，d1，dz}。 该 图 的 右 侧 给 出 使 用 这 些 存活 范围 重 写 名 字 而 得 的 代码 。 





前 枝 SSA 形 式 中 的 代码 片段 使 用 存活 范围 重 写 之 后 


图 13-5 发 现存 活 范围 


在 9.3.5 节 ， 我 们 看 到 ， 运 用 于 SSA 形 式 的 转换 可 能 将 复杂 因素 引 人 这 一 重 写 过 程 中 。 如 果 分 配器 构 
建 SSA 形 式 ， 并 使 用 这 一 形式 来 发 现存 活 范 围 ， 那 么 这 一 重 写 过 程 可 以 使 用 存活 范围 名 字 取 代 SSA 名 字 。 
另 一 方面 如果 分 配器 使 用 已 经 过 转换 的 SSA 形 式 ， 那么 这 一 重 写 过 程 必 须 处 理 9.3.5 节 所 述 的 复杂 问题 。 
因为 大 多 数 编 译 器 在 指令 饰 选 和 指令 调度 之 后 执行 分 配 ， 所 以 分 配器 消耗 的 代码 将 不 是 SSA 形 式 。 这 和 迫 
使 分 配器 构建 这 一 代码 的 SSA 形 式 并 保证 重 写 过 程 是 直截了当 的 。 


13.5.2 评估 全 局 溢出 代价 


为 了 做 出 有 意义 的 溢出 决定 ， 全 局 分 配器 需要 对 溢出 每 一 个 值 的 代价 做 出 评估 。 一 个 溢出 的 代价 有 
三 个 组 成 部 分 : 地 址 计算 、 内 存 操作 和 评估 执行 频率 。 

编译 器 设计 者 可 以 在 内 存 中 选择 溢出 值 的 驻 留 位 置 。 这 个 溢出 值 一 般 被 保存 在 当前 和 的 活动 记录 
(AR) 中 ,特别 是 如 图 6-5 所 示 的 寄存 器 存储 空间 ， 以 便 最 小 化 地 址 计算 的 代价 。 在 AR 中 存储 溢出 值 使 
分 配器 为 了 滋 出 生成 诸如 10adAI 或 者 storeAI 等 与 ra 相关 的 操作 。 这 样 的 操作 通常 避免 为 了 计算 溢出 地 
址 对 更 多 寄存 器 的 需求 。 

内 存 操作 的 代价 一 般 是 不 可 避免 的 。 如 果 目 标 机 器 有 非 缓冲 片 内 局 部 内 存 ， 正 如 很 多 嵌入 式 处 理 器 
所 拥有 的 那样 ， 那 么 编译 器 可 以 为 溢出 使 用 那个 内 存 。 更 一 般 地 ， 编 译 器 需要 保存 这 个 值 ， 而 当 后 面 的 
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操作 需要 这 个 值 时 从 内 存 中 恢复 它 。 随 着 内 存 等 待 时 间 的 增加 ， 所 需 的 1oad 和 store 操 作 的 代价 也 增加 。 
使 情况 在 某 种 程度 上 变 得 更 坏 的 是 ， 只 有 当 分 配器 绝对 需要 一 个 寄存 器 时 ， 它 才 插 入 溢出 操作 。 因 此 ， 
很 多 溢出 操作 出 现在 对 寄存 器 的 要 求 很 高 的 代码 中 ， 这 将 反 过 来 阻止 调度 器 把 这 些 操作 移 到 足够 远 的 地 
方 以 隐藏 内 存 等 待 时 间 。 编 译 器 设计 者 必须 期 望 溢出 位 置 停留 在 高 速 缓存 中 。( 自 相 了 矛盾 的 是 ， 仅 当 这 
些 位 置 被 反复 存 取 时 它们 才 停 留 在 高 速 缓 存 中 以 避免 替换 : 这 说 明 这 一 代码 正在 执行 太 多 的 溢出 . ) 


1. 负 溢出 代价 

对 于 包含 一 个 装 入 、 一 个 存储 而 且 没 有 其 他 使 用 的 存活 范围 ， 如 果 这 一 装 和 信和 存储 引用 相同 的 地 址 ， 
那么 这 个 存活 范围 应 该 得 到 一 个 负 溢 出 代价 。( 这 样 的 存活 范围 可 能 产生 于 为 了 改进 代码 的 转换 ， 例 如 ， 
如 果 使 用 被 优化 掉 ， 而 且 这 一 存储 产生 于 一 个 过 程 调用 而 不 是 一 个 新 值 的 定义 。) 有 时 候 ， 溢 出 一 个 存 
活 范围 可 以 消除 比 溢出 操作 代价 更 高 的 拷贝 操作 ;这 样 的 存活 范围 也 有 一 个 负 代价 。 带 有 负 滋 出 代价 的 
任意 存活 范围 都 应 该 溢出 ， 因 为 这 样 做 降低 对 寄存 器 的 需求 并 且 从 代码 中 移出 指令 。 


2. 无 限 溢出 代价 

有 些 存活 范围 很 短 而 使 得 溢出 它们 没有 任何 帮助 。 考 虑 紧 跟 在 其 定义 后 的 一 个 使 用 。 滋 出 这 一 定义 
和 使 用 将 产生 两 个 短 存活 范围 。 第 一 个 存活 范围 包含 这 个 定义 后 面 跟着 一 个 存储 ; 第 二 个 存活 范围 包含 
一 个 装 入 后 面 跟着 这 一 使 用 。 这 两 个 新 的 存活 范围 的 任意 一 个 所 使 用 的 寄存 器 都 不 少 于 原来 的 存活 范围 
所 使 用 的 寄存 器 ， 所 以 这 一 溢出 不 产生 效益 。 分 配器 应 该 给 原来 的 存活 范围 赋 一 个 无 限 的 溢出 代价 。 一 
个 存活 范围 一 般 应 该 有 无 限 的 溢出 代价 ， 如 果 没 有 其 他 存活 范围 在 它 的 定义 和 使 用 之 间 结 束 。 这 一 条 件 
保证 寄存 器 的 可 用 性 在 这 一 定义 和 使 用 之 间 不 发 生 改 变 。 | 

3. 计数 执行 频率 

为 了 计数 控制 流 图 中 基本 块 的 不 同 执行 频率 ， 编 译 器 应 该 使 用 一 个 评估 执行 计数 注释 每 一 个 块 ( 如 
果 不 是 每 一 个 引用 )。 大 多 数 编译 器 使 用 简单 的 启发 式 搜索 来 评估 执行 代价 。 一 个 通常 的 方法 就 是 假设 
每 一 个 循环 执行 十 次 。 因 此 ， 它 把 计数 10 赋 给 循环 内 部 的 一 个 装 入 ， 并 把 计数 100 赋 给 两 个 修 套 循环 内 
的 一 个 装 入 。 一 个 不 可 预测 的 1f-then-else 可 以 把 执行 计数 降低 到 一 半 。 在 实践 中 ， 这 些 评估 保证 倾向 
于 外 循环 的 溢出 而 不 是 内 循环 的 溢出 。 

为 了 评估 游 出 单一 引用 的 代价 ， 分 配器 对 地 址 计算 代价 和 内 存 操 作 代 价 求 和 ， 并 将 这 个 和 与 这 一 引 
用 的 评估 执行 频率 相 乘 。 对 于 每 一 个 存活 范围 ， 它 求 各 个 引用 的 代价 和 。 这 需要 对 这 一 代码 中 的 所 有 块 
做 一 次 遍历 。 分 配器 可 以 预先 计算 所 有 存活 范围 的 代价 ， 它 也 可 以 等 待 直到 发 现 它 必 须 至 少 溢出 一 个 值 。 


13.5.3 冲突 和 冲突 图 


一 个 全 局 寄存 器 分 配器 必须 模型 化 的 一 个 基本 效应 是 : 在 目标 寄存 器 集合 内 各 值 对 空间 的 竞争 。 考 
虑 两 个 不 同 的 存活 范围 LR 和 LR;。 如 果 在 程序 中 存在 一 个 操作 ， 在 这 一 操作 期 间 ，LR, 和 LRi 都 是 活 的 ， 
那么 它们 不 可 能 驻 留 在 相同 的 寄存 器 中 。( 一 个 物理 寄存 器 一 般 在 一 个 时 刻 只 能 保存 一 个 值 。) 我 们 说 
LR 和 LRI 冲 突 〈interfere)。 形 式 地 ，LRf 和 LRI 冲 突 ， 如 果 其 中 一 个 在 另 一 个 的 定义 处 是 活着 的 且 它 们 有 - 
不 同 的 值 。 

为 了 模型 化 这 一 分 配 问题 ， 编 译 器 可 以 构建 一 个 冲突 图 I=(N，E)， 其 中 ，N 中 的 结 点 表示 各 个 存活 
范围 ， 而 E 中 的 边 表示 存活 范围 之 间 的 冲突 。 因 此 ， 一 个 无 向 边 (n,，n))EI 存 在 ， 当 且 仅 当 相应 的 存活 范 
园 LRV 和 LR: 冲 突 。 图 13-6 给 出 图 13-5 的 代码 以 及 它 的 冲突 图 。[R: 与 其 他 每 一 个 存活 范围 都 冲突 。 然 而 ， 
其 余 的 存活 范围 互 不 冲突 。 

如 果 编 译 器 可 以 使 用 k 或 更 少 的 颜色 着 色 1， 那 么 它 可 以 把 这 些 颜 色 直 接 映 射 到 物理 寄存 器 上 来 产生 
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其 他 三 个 存活 范围 可 以 共享 一 种 颜色 ， 因 为 它们 互 不 冲突 。 因 此 ， 冲 突 图 是 2 着 色 的 ， 而 且 可 以 重 写 代 
码 使 其 恰好 使 用 两 个 寄存 器 。 





(一 地 
(Y 
带 有 存活 范围 的 代码 片段 冲突 图 


图 13-6 存活 范围 和 冲突 


考虑 ， 如 果 编 译 器 的 另 一 个 阶段 重 排序 B, 末 端的 两 个 操作 将 会 发 生 什 么 。 这 使 LR, 在 LR, 的 定义 处 是 
活着 的 。 分 配器 必须 把 边 (LR,，LR。) 加 到 E 中 ， 使 得 仅 使 用 两 种 颜色 无 法 着 色 这 个 图 。( 因为 这 一 图 很 
小 ， 因 此 通过 枚 举 就 可 以 证 明 这 一 点 。) 为 了 处 理 这 个 图 ， 分 配器 有 两 个 选择 : 使 用 三 个 寄存 器 ， 或 者 ， 
如 果 目 标 机 器 只 有 两 个 寄存 器 ， 那 么 在 B, 中 LR 的 定义 之 前 溢出 LR, 或 LR, 中 的 一 个 。 当 然 ， 这 一 分 配器 也 
可 能 重新 排序 这 两 个 操作 ， 消 除 LR, 与 LR 之 间 的 冲突 。 寄 存 器 分 配器 一 般 不 重 排 序 操作 。 相 反 ， 分 配器 
假设 操作 有 一 个 固定 的 顺序 ， 并 将 排序 问题 留 给 指令 调度 器 (参见 第 12 章 )。 


1. 构建 冲突 图 
一 旦 分 配器 构建 了 全 局 存活 范围 ， 并 使 用 它 的 LIVEOUT 和 集合 for each LR i 
注释 代码 中 的 每 一 个 基本 块 ， 它 就 能 够 通过 对 每 一 个 块 的 简单 线 create a node n; € N 


性 遍历 构造 冲突 图 。 图 13-7 给 出 这 一 基本 算法 。 当 分 配器 自 底 向 for each basic block b 
上 LIVENow + LIVEOUT (b) 
上 遍历 这 个 块 时 ， 它 计算 在 当前 操作 中 活着 的 值 的 集合 。 因 为 在 


fOr On, On1, 0n2 ...01 in b 





这 个 块 的 最 后 操作 处 LIVENOW 必 须 等 于 这 个 块 的 LIVEOUT 集 合 ， with form op; LRy LR, = LRe 

所 以 分 配器 把 LIVENOW 初 始 化 为 LIVEOUT。 随 着 分 配器 向 后 遍 AR DE 

历 这 一 块 ， 它 把 适当 的 边 加 到 正中 并 更 新 LIVENOW。 remove LR. from LIVENOW 
这 一 算法 实现 早 前 所 给 的 冲突 的 定义 : LR 和 LR 冲突 ， 当 且 add LR, & LR, to LIVENow 

仅 当 其 中 一 个 在 另 一 个 的 定义 处 是 活着 的 。 这 一 定义 允许 编译 器 

通过 在 每 一 个 操作 处 在 操作 LR 的 目标 与 这 一 操作 之 后 活着 的 每 一 图 13-7 构建 冲突 图 


个 存活 范围 之 间 加 入 一 个 冲突 来 创建 冲突 图 。 

拷贝 操作 需要 特殊 处 理 。 操 作 121 LR, 一 LRj 不 在 LR 与 LRj 之 间 创 建 神 突 ， 因为 这 些 值 可 以 占据 相同 
的 寄存 器 。 这 一 操作 不 应 该 包含 边 《LR,，LR,)。 如 果 其 后 的 某 个 上 下 文 迫使 在 这 些 存活 范围 之 间 有 一 个 
冲突 ， 那 么 那个 操作 将 创建 这 个 边 。 相 同 的 讨论 适用 于 4 函数 。 用 这 种 方法 处 理 指 贝 和 4 函数 使 分 配器 得 
到 何 时 LR, 和 LR4 占 据 相 同 寄存 器 的 精确 信息 。 结 果 的 冲突 图 可 以 充当 组 合 存活 范围 ， 并 消除 不 必要 的 持 
贝 的 强 有 力 的 结合 阶段 的 基础 (参见 13.5.6 节 )。 oe 

为 了 改进 分 配器 后 面 工作 的 效率 ， 编 译 器 应 该 同时 构建 表示 E 的 下 三 角 位 矩阵 和 邻接 表 集 合 。 位 矩 
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更 多 的 空间 ， 但 是 分 配器 高 频率 地 执行 这 两 个 操作 ， 使 得 这 一 代价 很 值得 。 编 译 器 设计 者 也 可 以 把 不 相 
交 寄 存 器 类 当 作 独 立 的 分 配 问题 来 处 理 ， 从 而 减 小 E 的 尺寸 和 整体 分 配 时 间 。 


2. 构建 分 配器 

为 了 构建 基于 图 着 色 范例 的 全 局 分 配器 ， 编 译 器 设计 者 需要 两 个 额外 的 机 制 。 第 一 ， 分 配器 需要 发 
现 k 着 色 的 技术 。 遗 憾 的 是 ， 对 于 特定 图 确定 它 是 否 存在 一 个 A 着色 是 NP 完全 问题 。 因 此 ， 寄 存 器 分 配器 
使 用 一 个 无 法 保证 找到 x 着 色 的 快速 近似 方法 。 第 二 ， 分 配器 需要 一 个 策略 来 处 理 对 于 一 特定 的 存活 范 
围 没有 剩余 颜色 的 情况 。 大 多 数 着 色 分 配器 通过 重 写 代码 改变 这 一 分 配 问题 来 逼近 这 样 的 分 配器 。 这 样 
的 分 配器 挑选 出 一 个 或 多 个 存活 范围 加 以 修改 。 它 或 者 溢出 或 者 分 割 被 选择 的 存活 范围 。 溢 出 把 被 选择 
存活 范围 变 成 多 个 微小 存活 范围 ， 围 绕 着 原来 的 存活 范围 中 的 每 一 个 定义 和 使 用 有 一 个 这 样 的 微小 存活 
范围 。 分 割 把 每 一 个 存活 范围 分 成 更 小 是 非 平凡 的 存活 范围 。 无 论 是 哪 一 种 情况 ， 转 换 后 的 代码 执行 相 
同 的 计算 ， 但 是 有 不 同 的 冲突 图 (包括 更 多 的 装 入 和 存储 )。 如 果 这 些 改 变 有 效 ， 那 么 新 的 冲突 图 是 x 着 
色 的 。 如 果 这 些 改 变 无 效 ， 那 么 分 配器 必须 溢出 更 多 存活 范围 。 


13.5.4 自 项 向 下 着 色 


自 顶 向 下 图 着 色 全 局 寄存 器 分 配器 使 用 低级 信息 给 各 个 存活 范围 指定 颜色 ， 并 使 用 高 级 信息 选择 它 
着 色 存活 范围 的 顺序 。 为 了 寻找 特定 存活 范围 LR 的 颜色 , 分 配器 记录 已 经 指定 给 LR, 在 /中 的 邻居 的 颜色 。 
如 果 邻 居 的 颜色 集合 不 是 完全 的 ， 即 有 一 种 或 多 种 颜色 没有 被 使 用 ， 那 么 分 配器 可 以 把 一 种 没有 使 用 的 
颜色 指定 给 LR。 如 果 邻 居 的 颜色 集合 是 完全 的 ， 那 么 没有 颜色 适合 LR ， 而 且 分 配器 必须 对 未 着 色 存 活 
范围 使 用 它 的 策略 。 

自 顶 向 下 分 配器 设法 以 由 某 个 等 级 函数 所 确定 的 顺序 着 色 存 活 范围 。 基 于 优先 度 的 自 顶 向 下 分 配器 
给 每 一 个 结 点 指定 一 个 等 级 ， 这 一 等 级 是 由 把 该 存活 范围 保存 在 寄存 器 中 而 积累 起 来 的 评估 运行 时 间 的 
节省 。 这 些 评估 与 13.5.2 节 所 描述 的 溢出 代价 类 似 。 自 顶 向 下 全 局 分 配器 为 由 这 些 等 级 定义 的 最 重要 的 
值 使 用 寄存 器 。 

分 配器 按 等 级 顺序 考虑 存活 范围 ， 并 试图 为 其 中 的 每 一 个 存活 范围 指定 一 种 颜色 。 如 果 没 有 颜色 适 
合 一 个 存活 范围 ， 那 么 分 配器 调用 溢出 或 分 割 机 制 处 理 这 一 未 着 色 的 存活 范围 。 为 了 改进 这 一 过 程 ， 分 
配器 可 以 把 存活 范围 划分 成 两 个 集合 : 限定 存活 范围 和 非 限定 活 范 围 。 一 个 存活 范围 是 限定 的 
(constrained )， 如 果 它 有 k 个 或 更 多 邻居 ， 即 它 在 1 中 的 度 >k。( 我 们 记 “LR; 的 度 ” 为 LRY， 所 以 LR! 是 限 
定 的 当 且 仅 当 LR1>k。) 限定 存活 范围 首先 按 等 级 顺序 被 着 色 。 在 所 有 限定 存活 范围 被 处 理 之 后 ， 非 限 
定 存活 范围 按 任意 顺序 被 着 色 。 因 为 一 个 非 限定 存活 范围 的 邻居 少 于 kK 个 ， 所 以 分 配器 总 可 以 为 它 找到 
一 种 颜色 ; 对 它 的 邻居 的 颜色 指定 不 能 使 用 所 有 Kk 种 颜色 。 

通过 首先 处 理 限 定 活 范围 ， 分 配器 避免 某 些 可 能 的 溢出 。 以 直接 的 优先 顺序 工作 的 另 一 个 方法 ， 可 
以 使 分 配器 把 所 有 可 能 的 颜色 指定 给 非 限定 但 是 有 较 高 优先 度 的 LR 的 邻居 。 这 可 能 迫使 LR 不 被 着 色 ， 
即使 一 定 存 在 它 的 非 限定 邻居 的 着 色 ， 使 得 存在 适合 LR 的 颜色 。 


1. 处 理 溢出 

当 自 项 向 下 分 配器 遇 到 一 个 不 能 被 着 色 的 存活 范围 时 ， 它 必须 或 者 溢出 或 者 分 割 存活 范围 的 某 个 集 
合 来 改变 这 一 问题 。 因 为 所 有 前 面 已 着 色 的 存活 范围 的 等 级 高 于 没有 着 色 的 存活 范围 ， 溢 出 没有 着 色 的 
存活 范围 比 溢出 前 面 已 着 色 的 存活 范围 更 有 意义 。 分 配器 可 以 考虑 重新 着 色 前 面 已 着 色 的 存活 范围 中 的 
一 个 , 但 是 它 必须 尽 可 能 避免 完全 的 一 般 性 以 及 回溯 的 代价 。 

为 了 溢出 LR,， 分 配器 在 LR: 的 每 一 个 定义 之 后 插入 一 个 存储 ， 并 在 LR; 的 每 一 个 使 用 之 前 插入 一 个 装 
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入 。 如 果 内 存 操作 需要 寄存 器 ， 那 么 分 配器 可 以 保留 足够 的 寄存 器 来 处 理 它 们 。( 例 如 ， 当 一 个 溢出 值 
在 使 用 前 被 装 入 时 ， 需 要 一 个 寄存 器 来 保存 这 个 溢出 值 。 ) 出 于 这 一 目的 所 需 的 寄存 器 的 数量 是 目标 机 
器 指令 集合 系统 的 一 个 函数 。 保 留 这 些 寄存 器 简化 溢出 。 

为 了 溢出 代码 而 保留 寄存 器 的 另 一 种 选择 是 : 在 每 一 个 定义 和 使 用 处 寻找 自由 颜色 ; 这 一 策略 可 以 
导致 这 样 一 种 状况 ， 在 这 一 状况 中 分 配器 必须 逆向 溢出 一 个 前 面 已 着 色 的 存活 范围 。9 当然 ， 自 相 了 矛盾 
的 地 方 是 : 为 溢出 保留 寄存 器 本 身 可 能 通过 从 效果 上 降低 k 而 引发 游 出 。 

2. 分 割 存活 范围 

溢出 改变 着 色 问题 。 一 个 未 着 色 的 存活 范围 被 分 割 成 一 系列 微小 存活 范围 ， 它 们 是 如 此 之 小 使 得 溢 
出 它们 是 没有 成 效 的 。 改 变 这 一 问题 的 一 个 相关 方法 是 : 取 一 个 未 着 色 存 活 范围 并 把 它 划 分 成 比 单一 引 
用 大 的 小 块 。 如 果 与 原来 的 存活 范围 相 比 ， 这 些 新 的 存活 范围 与 较 少 的 存活 范围 相互 冲突 ， 那 么 分 配器 
可 能 为 它们 找到 颜色 。 例 如 ， 如 果 新 存活 范围 是 非 限制 的 ， 那 么 一 定 存在 适合 它们 的 颜色 。 被 称 为 存活 
范围 分 割 (live-range splitting) 的 这 一 过 程 可 以 导致 一 个 分 配 ， 这 一 分 配 插入 的 装 入 和 存储 比 溢出 整个 
存活 范围 所 需 的 要 少 。 

由 Chow 构 建 的 第 一 个 自 顶 向 下 、 基 于 优先 度 的 着 色 分 配器 把 未 着 色 存 活 范围 划分 成 单一 块 存活 范 
围 ， 记 数 每 一 个 结果 存活 范围 的 冲突 度 。 然 后 ， 当 重新 组 合 相 邻 块 中 的 这 些 存 活 范围 仍 为 非 限制 存活 范 
围 时 ， 重 新 组 合 这 些 相 邻 块 的 存活 范围 。 它 对 分 割 存 活 范围 能 够 跨越 的 块 数量 设置 一 个 任意 的 上 限 。 它 
在 每 一 个 分 割 存 活 范围 的 开始 点 插入 一 个 装 和 信 ， 并 在 这 个 存活 范围 的 结束 端 插入 一 个 存储 。 分 配器 溢出 
仍然 未 着 色 的 任意 分 割 存活 范围 。 


13.5.5 自 底 向 上 着 色 


自 底 向 上 图 着 色 寄存 器 分 配器 使 用 很 多 与 自 顶 向 下 全 局 分 配器 相同 的 机 制 。 这 些 分 配器 发 现存 活 范 
围 ， 构 建 一 个 冲突 图 ， 试 图 去 着 色 它 ， 并 当 需 要 时 生成 溢出 代码 。 自 顶 向 下 和 自 底 向 上 分 配器 的 主要 差 
异 在 于 用 于 排序 着 色 存活 范围 的 机 制 不 同 。 自 顶 向 下 分 配器 使 用 高 级 信息 来 选择 着 色 顺序 ， 而 自 底 向 上 
分 配器 根据 关于 冲突 图 的 详细 结构 信息 计算 顺序 。 这 样 的 分 配器 构造 考虑 存活 范围 的 线性 顺序 ， 并 按 这 
一 顺序 制定 颜色 。 

为 了 排序 存活 范围 ， 自 底 向 上 图 着 色 分 配器 依赖 于 非 限定 “| initialize stack to empty 
存活 范围 对 颜色 是 平凡 的 这 一 事实 。 这 一 事实 在 构建 颜色 赋值 | whie (NAO) 
顺序 中 起 着 重要 的 作用 。 图 13-8 给 出 一 个 计算 这 样 的 顺序 的 简 Fan EN Mith n? < k 
单 算法 。 分 配器 反复 地 从 图 中 移出 一 个 结 点 ， 并 把 这 一 结 点 放 else node + n picked from N 
到 栈 上 。 它 使 用 两 个 不 同 的 机 制 来 选择 下 一 次 移出 的 结 点 。 第 remove node and its edges from 1 
一 个 子 语句 取 在 移出 的 图 中 非 限定 的 结 点 。 因 为 这 些 结 点 是 非 push node onto stack 
限定 的 ， 所 以 它们 移出 的 其 序 不 重要 。 移 出 一 个 非 限定 结 点 隆 
低 这 一 结 点 的 每 一 个 邻居 的 度 ， 也 有 可 能 使 它们 也 成 为 非 限定 
的 。 第 二 个 子 语句 只 有 当 每 一 个 余下 的 结 点 都 是 限定 时 才 被 使 用 ， 它 使 用 某 个 外 部 标准 挑选 出 一 个 结 点 。 
当 这 一 循环 停止 时 ， 此 图 是 空 的， 而且 栈 包含 按 移出 顺序 排列 的 所 有 结 点 。 

、 为 了 着 色 这 个 图 ， 分 配器 按 由 栈 所 表示 的 顺序 重新 构建 冲突 图 ， 即 按 分 配器 从 图 中 移出 结 点 的 相反 
顺序 。 它 反复 地 从 栈 中 弹出 结 点 n， 把 0 和 它 的 边 插入 回 / 中 ， 并 寻找 适合 n 的 颜色 。 使 用 伪 码 的 这 一 算法 


O “分 配器 将 在 每 一 个 溢出 场所 重新 计算 冲突 ， 并 计算 这 一 溢出 场所 的 邻居 的 颜色 集合 。 如 果 这 一 过 程 没有 在 
每 一 个 溢出 场所 发 现 可 用 的 颜色 ， 那 么 分 配器 溢出 这 一 溢出 场所 的 最 低 优先 度 的 邻居 。 递 归 溢出 已 着 色 存 
活 范围 的 可 能 性 导致 了 自 顶 向 下 的 、 基 于 优先 度 的 分 配器 的 大 多 数 实 现 保留 溢出 寄存 器 。 


图 13-8 计算 自 底下 上 顺序 
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如 下 所 示 。 
while (stack 4 0) 
node + pop(stack) 
insert node and its edges into I 
color node 
为 了 着 色 结 点 n， 分 配器 记录 n 在 当前 /的 近似 中 的 邻居 的 颜色 ， 并 给 mn 指定 一 种 未 使 用 的 颜色 。 旨 如 
果 没 有 颜色 留 给 了 mp， 那么 nm 保持 未 着 色 。 
当权 为 空 时 ，/ 已 经 重建 完毕 。 如 果 每 一 个 结 点 都 有 一 种 颜色 ， 那 么 分 配器 就 宣布 成 功 并 重 写 代码 ， 
使 用 物理 寄存 器 替换 存活 范围 名 字 。 如 果 任意 结 点 仍然 未 着 色 ， 那 么 分 配器 或 者 溢出 相应 的 存活 范围 或 
者 把 它 分 割 成 小 片 。 此 时 ， 典 型 的 自 底 向 上 分 配器 重 写 代码 以 反映 这 样 的 溢出 和 分 割 ， 并 重复 整个 过 程 : 
寻找 存活 范围 ， 构 建 / 并 着 色 它 。 这 一 过 程 反复 进行 ， 直 到 7 中 每 一 个 结 点 得 到 一 种 颜色 。 分 配器 一 般 在 
若干 次 迭代 中 停止 。 当 然 ， 自 底 向 上 分 配器 将 为 溢出 保留 寄存 器 ， 就 如 自 顶 向 下 分 配器 所 描述 的 那样 。 
这 一 策略 允许 它 在 一 次 遍历 之 后 停止 。 
为 什么 这 一 方法 起 作用 
自 底 向 上 分 配器 把 每 一 个 结 点 播 回 它 被 移出 的 图 中 。 如 果 表 示 LR, 的 结 点 因为 当时 它 是 非 限 定 的 而 
被 从 7 中 移出 ， 那 么 当 它 被 重新 插 回 /的 一 个 近似 中 去 时 ， 在 这 一 近似 中 它 仍 然 是 非 限定 的 。 因 此 ， 当 分 
配器 插入 LR1 时 ， 它 一 定 有 一 个 可 用 于 LR 的 颜色 。 得 不 到 颜色 的 惟一 结 点 是 使 用 图 13-8 中 的 else 子 语句 
中 的 溢出 度量 被 从 7 中 移出 的 结 点 。 这 些 结 点 被 插 人 它们 有 # 个 或 更 多 个 邻居 的 图 中 。 可 能 存在 一 种 适合 
它们 的 颜色 。 当 分 配器 把 结 点 n 插 入 ! 中 时 ， 假 设 n*>k。 它 的 邻居 不 能 都 有 不 同 的 颜色 ， 因 为 至 多 有 k 种 
颜色 。 如 果 它 们 刚好 有 k 种 颜色 ， 那 么 分 配器 找 不 到 可 用 于 n 的 颜色 。 相 反 ， 如 果 它 们 使 用 的 颜色 小 于 ， 
那么 分 配器 可 以 找到 一 种 可 用 于 "的 颜色 。 
这 一 移出 过 程 决定 结 点 被 着 色 的 蜂 序 。 这 一 顺序 非常 重要 ， 以 这 一 顺序 ， 它 确定 有 无 可 用 的 颜色 。 
对 于 那些 由 于 是 非 限 定 的 而 从 图 中 移出 的 结 点 ， 对 于 余下 的 结 点 来 说 顺序 并 不 重要 。 这 一 顺序 可 能 对 于 
已 在 栈 中 的 结 点 很 重要 ; 毕竟 ， 当 前 结 点 可 能 是 限定 的 ， 直 到 早 前 的 一 些 结 点 被 移出 。 对 于 由 图 13-8 中 
的 else 语 句 被 从 图 中 移出 的 结 点 ， 这 一 顺序 是 关键 的 。 只 有 当 每 一 个 余下 的 结 点 都 是 限定 结 点 时 ， 这 一 
语句 才 执 行 。 因 此 ， 余 下 的 结 点 形成 一 个 或 多 个 1 的 稠密 连结 的 子 图 。 
用 于 挑选 结 点 的 启发 式 搜索 通常 被 称 为 溢出 度量 (spill metric )。 由 Chaitin 等 构建 的 原始 的 自 底 向 上 
图 着 色 分 配器 使 用 一 种 简单 的 溢出 度量 。 它 挑选 出 最 小 化 比率 cosi/degree 的 结 点 ， 其 中 cost 是 估 测 溢出 
代价 ， 而 degree 则 是 在 当前 图 中 的 度 。 这 一 度量 挑选 出 溢出 成 本 相对 较 低 的 结 点 ， 但 降低 很 多 其 他 结 点 
的 度 。 人 们 还 尝试 了 很 多 其 他 溢出 度量 ， 其 中 包括 costdegreez， 这 一 度量 强调 对 邻居 的 影响 ; 强调 运行 
时 速度 的 cost 本 身 ; 以 及 最 小 化 溢出 操作 数量 ， 强 调 代 码 的 大 小 的 度量 。 前 两 个 cost/degree 和 cost/ 
degree? 试 图 平衡 代价 和 影响 ， 而 后 两 个 cost 和 溢出 操作 的 目的 在 于 优化 特定 标准 。 在 实践 中 ， 没 有 哪 一 
个 启发 式 搜索 占 绝对 优势 。 因 为 实际 的 着 色 过 程 相对 于 构建 更 快 ， 所 以 分 配器 可 以 尝试 若干 种 着 色 ， 
每 一 种 使 用 不 同 的 溢出 度量 , -并 保留 最 好 的 结果 。 


13.5.6 接合 存活 范围 以 降低 度 
编译 器 设计 者 可 以 构建 一 个 强大 的 接合 阶段 ， 使 用 冲突 图 来 决定 何 时 通过 拷贝 相连 的 两 个 存活 范围 


.可 以 接合 〈coalesce) 起 来 。 考 虑 操作 121 LRI 一 LRi。 如 果 LRi 和 LR: 不 冲突 ， 那 么 这 一 操作 可 以 被 消除 ， 


O 为 了 挑选 出 一 个 特定 颜色 ,每 一 次 它 可 以 以 一 个 相 容 的 顺序 进行 搜索 ， 或 者 它 可 以 用 循环 的 形式 指定 颜色 。 
以 我 们 的 经 验 ， 用 于 颜色 选择 的 机 制 没 有 什么 实际 意义 。 
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而 所 有 对 LR 的 引用 都 可 以 被 重 写成 对 LR 的 引用 。 接 合 这 些 存活 范围 有 若干 有 益 的 效应 。 它 消除 这 一 拷 
贝 操作 ， 使 得 代码 更 小 且 很 有 可 能 更 快 。 它 降低 与 LR 和 LR 都 冲突 的 任意 LR.S 的 度 。 它 缩小 存活 范围 的 
集合 ,使 得 1 及 许多 与 1 相关 的 数据 结构 变 小 。( 在 Briggs 的 论文 中 ， 他 给 出 接合 消除 三 分 之 一 存活 范围 的 
AT.) 因为 这 些 效应 有 助 于 分 配 ， 所 以 编译 器 通常 在 全 局 分 配器 中 的 着 色 阶段 之 前 执行 接合 。 

图 13-9 给 出 一 个 例子 。 源 代码 如 图 左边 所 示 ， 代 码 右 侧 的 直线 表示 每 一 个 相关 值 LR,、LR。 和 LR。 活 着 
的 区 域 。 即 使 LR, 与 L[Rw 和 LRe 交 选 ， 它 也 不 与 它们 中 的 任何 一 个 冲突 ， 因 为 一 个 拷贝 的 源头 和 目标 是 不 冲 
突 的 。 因 为 LR 在 LRe 的 定义 处 是 活 的 ， 所 以 二 者 冲突 。 两 个 拷贝 操作 都 是 接合 的 候选 者 。 


add LR, LR, => LR, add LR, LR, => LRap 
a ab 


i2i LR, => LR, 121 LRab => LR, 


i2i LR => LR | 
c 


add LR,,LR, => LR, add LRyp,LRy => LR, 
add LRe,LR, => LR, add LRe,LR, => LR, 


接合 之 后 的 LR, 和 LR。 





图 13-9 接合 存活 范围 


图 中 右 侧 的 片段 给 出 接合 LR, 和 LR, 生 成 LRw 的 结果 。 因 为 LR. 是 由 LRw 的 一 个 拷贝 定义 的 ， 所 以 它们 
不 冲突 。 结 合 LR, 和 LR, 形 成 LR 降低 了 LR. 的 度 。 一 般 地 ， 接 合 两 个 存活 范围 不 能 增加 它们 任意 邻居 的 度 。 
它 可 以 减 小 它们 的 度 ， 或 者 保持 它们 的 度 不 变 ， 但 是 它 不 能 增加 它们 的 度 。 

为 了 执行 接合 , 分 配器 遍历 每 一 个 块 并 检查 这 一 块 中 的 每 一 个 拷贝 操作 。 考 虑 一 个 拷贝 121 LRI 一 LRi。 
如 果 LR1 和 LR, 不 冲突 《(LR,，LR,s)ZE)， 那 么 分 配器 接合 它们 ， 消 除 这 一 拷贝 ， 并 更 新 [以 反映 这 一 接合 。 
分 配器 可 以 通过 把 从 表示 LR, 的 结 点 出 发 的 边 移动 为 从 表示 LR, 的 结 点 出 发 的 边 来 保守 地 更 新 [: 事实 上 ， 
是 把 LR; 作 为 LR,;。 这 一 更 新 不 是 精确 的 ， 但 是 它 使 分 配器 得 以 继续 接合 。 在 实践 中 ， 分 配器 合并 /允许 接 
合 的 每 一 个 存活 范围 ， 然 后 重 写 代码 ， 再 建 7， 并 再 次 尝试。 这 一 过 程 通常 在 几 组 接合 之 后 停止。 

本 例 展示 在 对 7 的 保守 更 新 中 固有 的 不 精确 性 。 事 实 上 ， 尽 管 LRe 和 LR. 之 间 不 存在 冲突 ， 这 一 更 新 
在 LRe 和 LRe 间 留 下 一 个 冲突 。 从 转换 代码 重建 产生 精确 的 冲突 图 ，LRu 和 LR. 之 间 没 有 边 ， 且 允许 分 配 
器 接合 LRw 和 LR。。 

因为 接合 两 个 存活 范围 可 能 阻止 其 他 存活 范围 的 一 系列 接合 ， 所 以 接合 的 顺序 是 关键 的 。 理 论 上 ， 
编译 器 应 该 首先 接合 最 频繁 执行 的 拷贝 。 在 实践 中 ， 分 配器 按 发 现 的 拷贝 在 块 的 循环 幅 亦 的 深度 所 决定 
的 硕 序 接合 这 些 拷贝 。 为 了 实现 这 一 点 ， 分 配器 可 以 校 从 最 深层 的 由 套 到 最 浅 婴 套 的 项 序 考虑 基本 块 。 


13.5.7 回顾 与 比较 


自 顶 向 下 和 自 底 向 上 着 色 分 配器 有 相同 的 基本 结构 ， 如 图 13-10 所 示 。 它 们 寻找 存活 范围 ， 构 建 冲 
突 图 ， 接 合 存活 范围 ， 计 算 代码 在 接合 版 本 上 的 溢出 代价 并 尝试 着 色 。 构 建 接合 的 过 程 反 复 进 行 ， 直 到 
它 再 也 找 不 到 机 会 。 着 色 后 ， 要 出 现 两 个 状况 中 的 一 种 。 如 果 每 一 个 存活 范围 都 得 到 一 种 颜色 ， 那 么 使 
用 物理 寄存 器 名 字 重 写 代 码 ， 分 配 结束 。 如 果 某 些 存活 范围 仍然 未 着 色 ， 那 么 插入 溢出 代码 。 


日 原 书 中 下 标 有 误 ， 应 为 k。 一 一 译 者 注 
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更 多 可 能 的 接合 





没有 为 溢出 保留 寄存 器 寄存 器 保留 


图 13-10 着 色 分 配器 的 结构 


如 果 分 配器 已 经 保留 了 溢出 寄存 器 ， 那 么 它 在 溢出 代码 中 使 用 这 些 寄 存 器 ， 使 用 它们 的 物理 寄存 
器 名 字 重 写 已 着 色 的 寄存 器 ， 这 一 过 程 终 止 。 否 则 ， 分 配器 开发 在 溢出 中 使 用 的 新 的 虚拟 寄存 器 名 字 
并 为 实现 这 一 溢出 插入 必要 的 装 和 人 和 存储 。 这 稍微 改变 了 着 色 问 题 ， 所 以 整个 分 配 过 程 在 转换 代码 上 
反复 进行 。 当 每 一 个 存活 范围 有 一 种 颜色 时 ， 分 配器 把 颜色 映射 到 真实 的 寄存 器 上 ， 并 把 代码 重 写成 
最 终 形式 。 

当然 ， 自 顶 向 下 的 分 配器 能 够 采用 用 于 自 底 向 上 分 配器 中 的 溢出 迭代 的 基本 原理 。 这 将 消除 保留 溢 
出 寄存 器 的 需要 。 同 样 地 ， 自 底 向 上 分 配器 能 够 保留 若干 溢出 寄存 器 ， 并 消除 迭代 整个 分 配 过 程 的 需求 。 
溢出 迭代 以 额外 的 编译 时 间 换取 使 用 较 少 溢出 代码 的 分 配 。 保 留 寄存 器 产生 可 能 包含 更 多 溢出 但 是 需要 
较 少 编译 时 间 的 分 配 。 

自 顶 向 下 分 配器 使 用 它 的 优先 度 等 级 排序 所 有 限定 结 点 。 它 以 任意 顺序 着 色 非 限定 结 点 ， 因 为 这 一 
顺序 不 能 改变 它们 得 到 一 种 颜色 的 事实 。 自 底 向 上 分 配器 构建 一 个 顺序 ， 对 于 这 一 顺序 ， 图 中 大 多 数 结 
点 都 在 一 个 它们 是 非 限定 的 图 中 被 着 色 。 在 自 底 向 上 分 配器 中 被 分 类 为 非 限定 的 每 一 个 结 点 都 被 自 底 向 
上 分 配器 着 色 ， 因 为 它们 在 7 的 原来 版 本 中 是 非 限定 的 ， 而 且 在 每 一 个 从 7 中 移出 结 点 和 边 而 得 到 的 图 中 
是 非 限定 的 。 为 移出 结 点 和 边 而 使 用 增 量 机 制 的 自 底 向 上 分 配器 ， 把 自 顶 向 下 分 配器 处 理 成 限定 结 点 的 
某 些 结 点 分 类 为 非 限定 结 点 。 这 些 结 点 在 自 顶 向 下 分 配器 中 仍 可 能 被 着 色 ; 在 不 实现 它们 的 算法 并 运行 
它们 的 情况 下 ， 无 法 清晰 地 比较 这 两 个 分 配器 在 这 些 结 点 上 的 性 能 。 

真正 难以 着 色 的 结 点 是 自 底 向 上 分 配器 使 用 它 的 溢出 度量 从 图 中 移出 的 那些 结 点 。 这 一 溢出 度量 只 
有 当 所 有 余下 结 点 都 是 限定 的 时 候 才 使 用 。 这 些 结 点 形成 [的 一 个 强 连通 子 图 。 在 自 顶 向 下 分 配器 中 ， 
这 些 结 点 将 按 由 它们 的 等 级 或 优先 度 确定 的 顺序 被 着 色 。 在 自 底 向 上 分 配器 中 ， 溢 出 度量 使 用 相同 的 等 
级 并 做 适当 调整 ， 调 整 的 程度 由 该 结 点 被 选择 时 度 被 降低 的 结 点 数目 决定 。 因 此 ， 自 顶 向 下 分 配器 选择 
溢出 低 优 先 度 的 限定 结 点 , 而 自 底 向 上 分 配器 溢出 在 所 有 非 限定 结 点 已 被 移出 后 仍然 是 限定 的 那些 结 点 。 
从 后 者 的 集合 中 ， 它 挑选 出 最 小 化 溢出 度量 的 结 点 。 


13.5.8 在 冲突 图 中 编码 机 器 限制 


寄存 器 分 配 必 须 考虑 目标 机 器 和 它 的 调用 约定 的 特殊 性 质 。 在 实践 中 所 引发 的 某 些 限定 可 以 在 着 色 
过 程 中 被 编码 。 

1. 多 寄存 器 值 

考虑 如 下 形式 的 目标 机 器 : 对 每 一 个 双 精 度 浮 点 值 需要 一 个 相 邻 寄存 器 的 直线 排列 对 和 一 个 带 有 两 
个 单 精度 存活 范围 LR, 和 LR, 和 一 个 双 精 度 存 活 范 围 的 LR. 的 程序 。 

对 于 冲突 (LR,。，LR。) 和 (LR。，LR。)， 在 13.5.3 节 所 述 的 技术 产生 左边 的 图 。 三 个 寄存 器 ro、ri 和 rr， 
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以 及 直线 排列 对 (ro r) 将 足以 构成 此 图 。LR. 和 LRs 可 以 共享 r; 而 把 对 (ro，ri) 留 给 LR.。 遗 憾 的 是 ， [649] 
此 图 不 足以 表示 分 配 上 的 真实 限制 。 

给 定 E=3， 自 底 向 上 着 色 分 配器 以 任意 顺序 指定 颜色 ， 因 为 没有 结 点 的 度 >k。 如 (Re 一 (Re) 
果 这 一 分 配器 考虑 LR.， 首 先 它 会 成 功 ， 因 为 (ro m) 可 以 自由 地 保存 LRe。 如 果 LR, 或 
LRs 首 先 被 着 色 ， 那 么 分 配器 可 能 使 用 re 或 ri， 创 建 直线 排列 寄存 器 对 LR. 不 可 用 的 状态 。 (R) 

为 了 强制 一 个 适当 的 顺序 ， 分 配器 可 以 插入 两 个 边 来 表示 要 与 一 个 需要 两 个 寄存 
器 的 值 的 神 突 。 这 产生 左边 的 图 。 利 用 此 图 和 k=3， 自 底 向 上 分 配器 必须 首先 移出 LR, 或 LR, 中 的 一 个 ， 
因为 LR 有 度 4。 这 保证 两 个 寄存 器 对 LR 都 可 用 。 

双重 边 产 生 一 个 正确 的 分 配 ， 因 为 它们 使 用 实际 资源 需求 来 搭配 与 LR. 神 突 的 结 点 的 度 。 它 不 保证 
一 个 相 邻 对 对 LR。 可 用 。 粳 糕 的 赋值 可 以 使 LR 没 有 可 用 对 。 例 如 ， 使 用 着 色 顺 序 LR,、 
LR.、LR,， 分 配器 可 能 把 r, 冉 给 LR.。 编 译 器 设计 者 可 以 通过 在 非 限定 结 点 间 首 先 选择 单 CAR) 
寄存 器 值 来 使 着 色 顺 序 向 LR. 倾 斜 (图 13-8 中 的 then 子 语句 )。 分 配器 可 以 采用 的 另 -种 || 
方法 是 : 如 果 当 它 试图 指定 颜色 时 没有 可 用 的 适当 序 对 ， 那 么 它 在 LR。 的 邻居 间 执 行 局 C 
限 性 的 重新 着 色 。 

2. 特定 寄存 器 放置 

寄存 器 分 配器 还 必须 考虑 对 存活 范围 的 特定 放置 的 需求 。 这 些 限制 来 自 于 几 个 方面 。 有 些 操作 可 
能 需要 它们 的 操作 数 在 特定 的 寄存 器 中 ; 例如 ，Interl x86 机 器 上 的 短 无 符号 乘法 总 是 把 它 的 结果 写 到 
AX 寄 存 器 中 。 这 一 链接 约定 指明 传送 到 寄存 器 的 值 的 放置 ， 这 可 以 包含 ARP， 某 些 或 所 有 实 参 以 及 返 
回 值 。 

例如 ， 如 果 存 活 范围 LR, 在 一 个 调用 场所 被 作为 实 参 传递 ， 链 楼 约 定 可 能 需要 它 在 调用 期 间 居留 在 
寄存 器 ,中 。 因 此， 我 们 希望 分 配器 把 LR, 赋 给 rs。 编译 器 设计 者 可 以 在 神 突 图 中 这 样 编码 诸如 此 类 的 限 
fl: 对 每 一 个 物理 寄存 器 向 N 中 加 入 一 个 结 点 ， 并 使 用 边 来 限制 值 的 放置 。 例 如 ， 为 了 把 LR, 强 制 到 r,， 
分 配器 可 以 加 入 一 个 从 LR, 到 其 他 每 一 个 物理 寄存 器 的 结 点 的 边 。 

当然 ， 加 入 物理 寄存 器 的 边 可 能 对 冲突 图 施加 过 多 的 限制 ， 人 迫使 某 些 限定 值 溢出 。 如 果 LR, 和 LR, 在 
不 同 的 调用 场所 作为 参数 被 传送 ， 并 且 二 者 都 必须 驻 留 在 ra 中 ， 那 么 仅 当 LR, 和 LR, 不 冲突 时 分 配器 能 够 
满足 这 一 限制 。 分 配器 必须 溢出 一 个 或 两 个 值 来 产生 一 个 分 配 和 赋值 以 把 它们 跨越 这 些 值 的 调用 放置 在 
rH. 

对 于 这 一 问题 的 另 一 个 方法 是 ， 把 这 一 限制 编码 到 代码 中 。 在 这 里 ， 编 译 器 在 它 把 LR, 评 估 为 一 个 参 
数 的 地 点 插入 一 个 从 LR 到 r, 的 拷贝 。 当 LR, 作 为 一 个 参数 出 现时 ， 编 译 器 采用 相同 的 作法 。 这 在 调用 场 
所 创建 一 个 小 的 存活 范围 ， 这 些小 存活 范围 可 以 被 预先 着 色 成 rs。( 在 指定 任意 颜色 之 前 ， 分 配器 把 这 些 
限定 的 存活 范围 赋 给 它们 要 求 的 寄存 器 。) 然后 ， 分 配器 依赖 于 保守 的 连接 或 有 倾向 的 着 色 来 在 可 能 的 
情况 下 消除 这 些 拷贝 。 如 果 拷 贝 不 能 被 消除 ， 那 么 它 可 能 允许 分 配器 避免 溢出 一 个 完整 的 存活 范围 。 


13.6 高 级 话题 


因为 在 寄存 器 分 配 期 间 错 误 的 代价 会 很 高 ， 所 以 寄存 器 分 配 算法 已 得 到 大 量 的 关注 。 已 出 版 了 很 多 
关于 基本 图 着 色 分 配 技 术 。13.6.1 节 描述 其 中 的 几 个 方法 。 如 本 章 所 描述 的 那样 ， 全 局 分 配器 也 同样 适 
用 于 很 多 程序 和 很 多 体系 结构 。13.6.2 节 给 出 寄存 器 分 配 中 存在 较 困 难 问题 的 三 个 领域 。 


13.6.1 MES MABE eH 
文献 中 已 出 现 很 多 关于 这 两 个 基本 图 着 色 寄 存 器 分 配 的 变形 。 本 节 描 述 其 中 若干 个 改进 版 本 。 其 中 
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一 些 关 注 分 配 的 代价 ， 而 另外 一 些 关注 分 配 的 质量 。 

1. 非 精确 冲突 图 

Chow 的 自 顶 向 下 、 基 于 优先 度 的 分 配器 使 用 了 冲突 的 一 种 不 精确 概念 : 存活 范围 LR 和 LRi 冲 突 ， 如 
果 二 者 在 同一 基本 块 内 是 活 的 。 这 能 够 加 快 冲突 图 的 构建 。 然 而 ， 此 图 的 不 精确 特性 过 高 评估 某 些 结 点 
的 度 ， 并 阻止 分 配器 使 用 冲突 图 作为 接合 的 基础 。( 在 一 个 不 精确 的 图 中 ， 由 一 个 有 用 拷贝 连接 的 两 个 
存活 范围 是 冲突 的 ， 因 为 它们 在 同一 基本 块 内 是 活 的 。) 分 配器 还 包含 一 个 预 遍 来 在 存活 范围 局 限于 在 
一 个 块 的 值 上 执行 局 部 分 配 。 

2. 把 冲突 图 分 割 成 为 小 片 

如 果 冲 突 图 能 够 被 分 成 不 连结 的 成 份 ， 那 么 那些 不 相交 的 成 份 可 以 独立 着 色 。 因 为 位 矩阵 的 大 小 是 
00V)， 所 以 把 这 一 位 矩阵 分 割 成 独立 的 成 份 即 可 以 第 省 空间 也 可 以 节省 时 间 。 分 割 冲 突 图 的 一 个 方法 是 


分 别 考 虑 不 重合 的 寄存 器 类 ， 如 浮 点 寄存 器 和 整数 寄存 器 。 对 于 较 大 过 程 的 一 个 更 复杂 的 选择 是 发 现 集 


团 分 离子 ， 集 团 分 离子 是 这 样 的 连通 子 图 ， 它 们 的 消除 把 冲突 图 分 成 互 不 相交 的 若干 片 。 对 于 是 够 大 的 
图 ， 使 用 散 列表 来 取代 位 矩阵 可 以 提高 时 空 效 率 。 

3. 保守 接合 

当 分 配器 接合 两 个 存 话 范围 LR, 和 LR4 时 ， 新 的 存活 范围 LR,; 可 能 比 LR 或 LRj 受 到 更 多 的 限制 。 如 果 
LR1 和 LR, 有 不 同 的 邻居 ， 那 么 LR1; > max(LRI ，LR9)。 如 果 LR1 < 大 ， 那 么 创建 LR, 是 绝对 有 益 的 。 然 而 ， 
如 果 LRY<K 上 且 LRj <K 但 LR4 >k， 那 么 ， 接 合 LR1 和 LR 使 得 /在 不 溢出 的 情况 下 更 难 着 色 。 为 了 避免 这 一 问 
题 ， 一 些 编译 器 设计 者 使 用 被 称 为 保守 接合 (conservative coalescing) 的 一 种 接合 的 限定 形式 。 在 这 一 
方案 中 ， 只 有 当 LR?;<k 了 时 分 配器 才 接 合 LR 和 LR,。 这 保证 LR 和 LRJ 的 接合 不 会 使 冲突 图 更 难 着 色 。 

如 果 分 配器 使 用 保守 接合 ， 另 一 种 改进 是 可 能 的 。 当 分 配器 达到 这 样 一 个 点 ， 在 此 处 每 一 个 留 下 的 
存活 范围 是 限定 的 ， 此 时 基本 算法 选择 一 个 溢出 候选 。 另 外 一 个 方法 是 在 这 一 点 处 再 次 运用 接合 。 由 于 
结果 存活 范围 的 度 而 没有 被 接合 的 存活 范围 ， 可 能 在 简化 图 中 得 到 接合 。 接 合 可 以 降低 与 拷贝 的 源头 和 
目标 都 冲突 的 结 点 的 度 。 因 此 ， 这 一 迭代 接合 (iterated coalescing) 可 以 消除 额外 的 拷贝 并 降低 结 点 的 
度 。 它 可 以 创建 一 个 或 多 个 非 限制 结 点 并 允许 着 色 进 行 。 如 果 它 不 创建 任何 非 限制 结 点 ， 那 么 溢出 如 前 
一 样 进行 。 

偏 着 色 (biased coloring) 是 接合 使 图 更 难 着 色 的 拷贝 的 另外 一 种 方法 。 在 这 一 方法 中 ， 分 配器 设 
法 给 由 一 个 拷贝 连接 的 存活 范围 指定 相同 的 颜色 。 在 挑选 LR 的 颜色 时 ， 分 配器 首先 尝试 这 样 的 颜色 ， 
这 些 颜色 己 赋 给 通过 一 个 拷贝 操作 连结 到 LR; 的 那些 存活 范围 。 如 果 分 配器 能 够 给 二 者 赋 相 同 的 颜色 ， 
那么 它 消除 这 一 拷贝 。 通 过 细心 的 实现 ， 这 对 着 色 过 程 增加 很 少 代价 或 不 增加 代价 。 

4. 滋 出 部 分 存活 范围 

如 前 所 述 ， 全 局 分 配 的 两 个 方法 都 溢出 整个 存活 范围 。 如 果 对 寄存 器 的 需求 在 整个 存活 范围 的 大 部 
分 区 域 较 低 而 在 一 个 较 小 的 区 域 较 高 时 ， 上 述 方法 将 导致 过 度 溢 出 。 更 复杂 的 溢出 技术 寻找 一 个 区 域 ， 
在 这 个 区 域 中 ， 溢 出 存活 范围 是 有 价值 的 ， 也 就 是 说 ， 这 一 溢出 在 真正 需要 寄存 器 的 区 域 释放 寄存 器 。 
自 顶 下 向 分 配器 所 描述 的 分 割 方案 通过 分 别 考虑 已 溢出 存活 范围 内 的 每 一 个 块 而 实现 这 一 点 。 在 自 底 向 
上 分 配器 中 ， 通 过 只 在 冲突 出 现 的 区 域 溢出 可 以 得 到 类 似 的 结果 。 一 个 被 称 为 冲突 区 域 凑 出 
(ingterference-region spillin ) 的 技术 识别 在 高 需求 区 域内 冲突 的 一 组 存活 范围 ， 并 把 溢出 限制 在 这 一 区 
域内 。 分 配器 可 以 评估 神 突 区 域 溢出 的 若干 策略 的 代价 ， 并 对 照 标准 的 随处 溢出 方 靶 比较 这 些 代价 。 通 
过 让 这 些 选 择 在 一 个 已 评估 代价 的 基础 上 进行 竞争 ， 分 配器 可 以 改进 整个 分 配 。 
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5. 存活 范围 的 分 割 

把 一 个 存活 范围 分 割 成 小 块 可 以 改进 基于 着 色 的 寄存 器 分 配 的 结果 。 理 论 上 ， 分 割 利用 两 个 不 同 的 
效应 。 如 果 已 分 割 存 活 范围 的 度 比 原来 的 存活 范围 的 度 低 ， 那 么 它们 可 能 更 容易 着 色 ， 其 至 可 能 是 非 限 
制 的 。 如 果 已 分 割 存活 范围 中 的 一 个 有 较 高 的 度 ， 因 此 溢出 ， 那 么 分 割 可 能 阻止 原来 同一 存活 范围 中 有 
较 低 度 的 部 分 的 游 出 。 作 为 最 终 的 实际 效应 ， 分 割 在 存活 范围 被 分 割 的 地 点 引入 溢出 。 精 心 选择 分 割 点 
可 以 控制 某 个 以 出 代码 的 放置 ， 例 如 放 在 循环 的 外 部 而 不 是 循环 的 内 部 。 

人 们 已 经 尝试 了 很 多 分 割 方法 。13.5.4 节 描述 了 一 种 方法 ， 这 一 方法 把 一 个 存活 范围 分 割 成 块 ， 并 
在 不 改变 分 配器 指定 颜色 的 能 力 的 前 提 下 ， 把 它们 再 次 接合 到 一 起 。 人 们 已 经 尝试 了 若干 使 用 控制 流 图 
的 性 质 来 选择 分 割 点 的 方法 。Briggs 指 出 很 多 方法 是 不 相 容 的 [45]; 然而 ， 两 个 特殊 的 技术 很 有 前 景 。 
一 个 方法 称 为 索 代 价 分 割 (zero-cost splitting)， 这 一 方法 利用 指令 调度 中 的 nop 来 分 割 存 活 范围 并 改进 
分 配 和 调度 。 另 一 个 技术 称 为 被 动 分 着 (passive splitting)， 这 一 技术 使 用 有 向 冲突 图 来 决定 分 割 应 该 发 
生 的 地 点 ， 并 基于 对 分 割 和 溢出 的 代价 的 评估 在 它们 之 间 做 出 选择 。 

6. 重新 实现 

对 于 某 些 值 ， 重 新 计算 比 溢出 成 本 低 。 例 如 ， 可 以 使 用 一 个 装 入 立即 重新 创建 一 个 小 整数 常量 ， 
而 不 是 使 用 一 个 装 入 从 内 存 中 重新 得 到 它 。 分 配器 能 够 识别 出 这 样 的 值 并 重新 实现 它们 ， 而 不 是 溢出 
它们 。 

修改 自 底 向 上 图 着 色 分 配器 来 执行 重新 实现 需要 几 个 小 变动 。 分 配器 必须 识别 和 标记 可 以 被 重新 实 
现 的 SSA 名 字 。 例 如 ， 参 数 总 是 可 用 的 任意 操作 是 一 个 候选 。 分 配器 可 以 使 用 第 10 章 给 出 的 常量 传播 算 
法 中 的 一 个 ， 在 代码 上 传播 这 些 重新 实现 标记 。 在 形成 存活 范围 的 过 程 中 ， 分 配器 应 该 只 接合 有 相同 重 
新 实现 标记 的 SSA 名 字 。 

编译 器 设计 者 必须 使 溢出 代价 评估 正确 处 理 重 新 实现 标记 ， 使 得 这 些 值 有 精确 的 溢出 代价 评估 。 洲 
出 代价 插入 过 程 还 必须 检查 这 些 标记 并 为 可 重新 实现 值 生成 适当 的 微小 溢出 。 最 后 ， 分 配器 应 该 使 用 保 
守 接 合 来 永久 地 避免 把 存活 范围 与 不 同 的 重新 实现 标记 组 合 起 来 。 


13.6.2 寄存 器 分 配 中 较 困难 的 问题 


本 章 已 给 出 一 些 处 理 寄存 器 分 配 中 的 问题 的 算法 。 还 有 很 多 更 加 困难 的 问题 。 在 若干 前 沿 领 域 仍 存 
在 着 改进 的 空间 。 

1. 整个 程序 的 分 配 

本 章 所 给 出 的 算法 都 是 在 单一 过 程 内 考虑 寄存 器 分 配 。 当 然 ， 整 个 程序 是 由 多 个 过 程 构建 起 来 的 。 
如 果 ， 通 过 考虑 更 大 的 作用 域 ， 全 局 分 配 产生 的 结果 比 局 部 分 配 的 结果 好 ， 那 么 编译 器 设计 者 是 否 应 该 
在 整个 程序 上 考虑 执行 分 配 呢 ? 整个 程序 优化 有 把 溢出 跨越 过 程 边界 移动 而 得 到 定制 过 程 调用 约定 和 消 
除 保存 和 恢复 的 效应 。 . 

然而 ， 当 把 分 配 问题 从 单一 过 程 扩 展 到 整个 程序 时 ， 它 发 生 重大 的 改变 。 所 有 整个 程序 分 配方 案 都 
必须 处 理 下 面 的 每 一 个 问题 。 

为 了 执行 整个 程序 分 配 ， 分 配器 必须 存 取 整 个 程序 的 代码 。 事 实 上 ， 这 意味 着 在 链接 时 执行 整个 程 
序 分 配 。( 当 整 个 程序 分 析 和 转换 在 链接 时 之 前 可 以 运用 时 ， 通 过 在 链接 时 执行 这 些 技术 可 以 有 效 地 回 
避 复 杂 化 这 样 技术 的 实现 中 出 现 的 很 多 问题 …) 

编译 器 需要 对 整个 程序 的 所 有 各 个 部 分 的 相对 执行 频率 进行 精确 的 评估 。 在 一 个 过 程 内 ， 静 态 评估 
(例如 “一 个 循环 执行 10 次 ”) 已 证 明 是 真实 行为 的 一 个 合理 的 近似 。 跨 越 整个 程序 ， 这 样 简单 的 评估 器 
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可 能 无 法 提供 真实 行为 的 好 的 近似 。 

整个 程序 分 配器 还 必须 处 理 参数 绑 定 机 制 。 而 引用 调用 参数 可 以 把 不 同 过 程 中 独立 的 存活 范围 连 
结 成 一 个 单一 过 程 间 存活 范围 。 由 于 必须 对 这 一 过 程 间 存 活 范围 设置 太 多 的 限制 ， 这 一 效应 将 会 复杂 
化 分 配 。 

2. 分 割 寄存 器 集合 

新 的 硬件 特性 可 能 引发 新 的 复杂 性 。 例 如 ， 考 虑 在 已 划分 寄存 器 集合 的 机 器 上 所 引发 的 不 一 致 代价 
问题 。 当 功能 单元 的 数量 增加 时 ， 保 存 操作 数 和 结果 所 需 的 寄存 器 的 数量 也 增加 。 在 寄存 器 和 功能 单元 
之 间 移 动 值 所 需要 的 硬件 逻辑 中 的 限制 也 会 增加 。 为 了 保持 硬件 代价 可 管理 ， 一 些 设计 师 把 寄存 器 集合 
划分 成 了 更 小 的 寄存 器 卷 ， 并 根据 这 些 寄 存 器 集合 对 功能 单元 分 组 群 。 为 了 保持 一 般 性 ， 处 理 器 通常 提 
供 在 这 些 组 群 间 移动 值 的 某 些 有 限 机 制 。 图 13-11 给 出 这 样 的 处 理 器 的 一 个 抽象 形式 。 不 失 一 般 性 ， 假 
设 每 一 组 群 有 一 组 除名 字 以 外 有 相同 的 功能 单元 和 寄存 器 集合 。 





图 13-11 组 群 寄存 器 集合 机 器 


带 有 组 群 寄 存 器 集合 的 机 器 把 一 组 新 的 复杂 性 划分 成 不 同 层 次 的 寄存 器 赋值 问题 。 在 决定 LR, 在 寄 
存 器 集合 的 位 置 的 过 程 中 ， 分 配器 必须 处 理 每 一 个 组 群 中 的 寄存 器 的 可 用 性 、 组 群 间 转换 机 制 的 代价 和 
局 部 可 用 性 ， 以 及 执行 引用 LR, 的 操作 的 特定 功能 单元 等 问题 。 例 如 ， 每 一 个 周期 每 一 个 组 群 只 能 有 一 
个 组 群 间 转 换 ， 处 理 器 可 能 允许 每 一 个 组 群 在 每 一 个 周期 生成 一 个 组 群 外 寄存 器 引用 。 对 于 这 样 的 限制 ， 
分 配器 必须 对 操作 的 放置 所 在 的 组 群 和 时 间 给 予 关注 。( 显然 ， 这 一 问题 需要 受到 指令 调度 器 和 寄存 器 
分 配器 的 关注 .) 有 些 体系 结构 允许 在 组 群 间 移 动 值 的 寄存 器 到 寄存 器 拷贝 操作 ， 并 附带 在 单一 周期 移 
出 移入 每 一 个 组 群 的 值 的 数量 的 限制 。 在 这 样 的 体系 结构 中 ， 一 个 值 的 跨 组 群 使 用 需要 额外 的 指令 ; 如 
果 在 一 个 关键 路 径 进行 跨 组 群 使 用 ， 这 将 延长 整个 执行 时 间 。 

3. 歧义 值 

在 频繁 使 用 歧义 值 的 代码 中 ， 分 配器 是 否 有 把 这 样 的 值 保存 在 寄存 器 中 的 能 力 是 一 个 非常 严肃 的 性 
能 问题 。 为 了 改进 歧义 值 的 分 配 ， 若干 系统 包含 了 重 写 代码 来 将 非 歧 义 值 保存 在 标量 局 部 变量 中 的 转换 ， 
即使 它们 的 “自然 ”的 家 是 在 一 个 数组 元 素 内 或 是 在 基于 指针 的 结构 内 。 标 量 替 换 (scalar replacement) 
使 用 数组 下 标 分 析 来 识别 数组 元 素 值 的 复 用 ， 并 引入 保存 复 用 值 的 标量 临时 变量 。 寄 存 器 提升 
(register-promotion) 使 用 指针 值 的 数据 流 分 析 来 决定 何 时 一 个 基于 指针 的 值 在 一 个 循环 嵌 套 中 可 以 安全 
地 保存 在 寄存 器 中 ， 并 重 写 代码 使 这 个 值 被 保存 在 一 个 新 的 临时 变量 中 。 这 两 个 转换 把 分 析 结 果 编 码 到 
代码 形态 中 ， 使 对 寄存 器 分 配器 来 说 把 这 些 值 保存 在 寄存 器 中 是 显然 的 。 事 实 上 ， 提 升 太 多 的 值 可 能 产 
生 溢 出 代码 ， 其 代价 超过 转换 试图 回避 的 内 存 操 作 的 代价 ;理想 上 ， 这 些 技术 都 应 该 集成 到 分 配器 中 ， 
以 便 其 中 对 寄存 器 需求 的 真实 评估 可 以 用 于 决定 提升 多 少 个 值 。 
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13.7 概括 和 展望 


因为 寄存 器 分 配器 是 现代 编译 器 的 重要 组 成 部 分 ， 所 以 人 们 在 文献 中 对 它 已 经 投入 了 很 多 的 关注 。 
对 于 局 部 分 配 、 全 局 分 配 和 区 域 分 配 都 存在 很 强 的 技术 。 因 为 其 基本 问题 几乎 都 是 NP 困难 的 ， 所 以 解 
决 方案 倾向 对 细小 决策 敏感 ， 诸 如 如 何 打破 相同 等 级 的 选择 等 。 

寄存 器 分 配 中 的 进展 来 自 于 对 于 这 些 问 题 给 予 我 们 深远 影响 的 范例 的 使 用 。 因 此 ， 图 着 色 分 配器 一 
直 很 受 欢迎 ,这 不 是 因为 寄存 器 分 配 相当 于 图 着 色 , 而 是 因为 着 色 捕 获 了 全 局 分 配 间 题 的 某 些 关 键 方面 。 
事实 上 ， 大 多 数 着 色 分 配器 的 改进 都 来 自 于 对 着 色 范 例 没 能 精确 反映 这 一 问题 的 地 方 所 做 的 进攻 ， 诸 如 
存活 范围 分 割 的 更 好 代价 模型 和 改进 方法 就 是 如 此 。 


本 章 注 释 


作为 一 个 问题 ， 寄 存 器 分 配 源 自 最 早 的 编译 器 。Backus 指 出 Best 于 20 世 纪 50 年 代 中 期 在 开发 原始 
FORTRAN 编 译 器 时 发 明了 我 们 称 之 为 “ 自 底 向 上 局 部 ”的 算法 [26，25]。 多 年 来 ，Best 的 算法 在 很 多 上 
下 文中 重新 被 发 现 并 复 用 [33，173，109，237]。 这 一 算法 的 最 广为人知 的 具体 形式 可 能 是 Belady 的 脱 机 
页 替换 算法 [33]。Horwitz[186] 和 Kennedy[202] 描 述 了 组 合 净值 和 不 净值 引发 的 复杂 性 问题 。Liberatore 
等 提出 在 溢出 不 净值 之 前 溢出 净值 是 一 个 可 行 的 折 中 方法 [237]。(13.3.2 节 中 的 ) 展示 净值 和 不 净值 引 
发 的 问题 的 例子 是 由 Ken Kennedy 提 出 的 。 

文献 中 所 描述 的 第 一 个 图 着 色 全 局 分 配器 是 由 Chaitin 和 他 的 同事 在 IBM 的 PL.8 编 译 器 上 构建 的 自 底 
向 上 分 配器 [70，68，69]。 反 过 来 ， 它 构建 于 最 初 由 Lavrov[232] 提 出 的 图 着 色 和 存储 分 配 问题 之 间 的 关 
系 上 。Alpha 编 译 器 项 目 把 这 些 想法 用 于 把 数据 封装 到 内 存 中 [132，133]。Schwartz 描 述 了 由 Ershov 和 
Cocke 分 别提 出 的 早期 算法 [300]; 这 些 算法 致力 于 减 小 所 使 用 的 颜色 的 数量 并 忽视 溢出 。 ` 

自 顶 向 下 图 着 色 源 于 Chow[76,77,78]。 他 的 实现 是 从 内 存 到 内 存 模型 开始 的 ， 使 用 了 一 个 不 精确 冲 
突 图 ， 并 执行 13.5.4 节 所 述 的 存活 范围 分 割 。 不 精确 冲突 图 不 支持 接合 ， 所 以 编译 器 使 用 独立 的 优化 遍 
来 接合 拷贝 [76]。 这 一 风格 的 分 配 已 被 用 于 MIPS、Silicon Graphics 中 的 若干 编译 器 中 ， 并 被 用 于 Gnu 编 
译 器 gcc 中 。Larus 和 Hilfinger 为 SPUR LISP 构 建 了 一 个 使 用 精确 冲突 图 并 操作 在 寄存 器 到 寄存 器 模型 上 
[231] 的 自 顶 向 下 、 基 于 优先 度 的 分 配器 。 ， 

13.5.5 节 中 的 自 底 向 上 分 配器 遵循 由 Briggs 修 改 的 Chaitin 的 设计 [48,49.53]。Chaitin 的 贡献 包括 冲突 
的 基本 定义 和 构建 冲突 图 、 接 合 及 处 理 溢出 的 算法 。Briggs 通 过 把 限定 存活 范围 压 人 栈 上 ， 而 不 是 直接 
溢出 它们 ， 修改 了 Chaitin 的 设计 ， 这 使 Briggs 分 配器 可 以 对 带 有 很 多 使 用 很 少 颜 色 的 邻居 的 结 点 进行 着 
色 。 自 底 向 上 着 色 中 其 他 有 意义 的 改进 包括 更 好 的 溢出 度量 、 干 净 溢 出 、 三 中 取 最 佳 溢出 [36]、 冲 突 区 
域 溢 出 [351， 重 新 实现 简单 值 的 方法 [52]、 迭 代 接 合 [153]、 优 化 接合 [270]、 溢 出 部 分 存活 范围 的 方法 
[35] 以 及 诸如 零 代 价 分 割 1225] 和 被 动 分 割 [100] 等 存活 范围 分 割 的 方法 。 精 确 冲 突 图 的 较 大 尺寸 导致 
Gupta、Soffa 和 Steele 对 使 用 组 群 分 离子 分 割 图 进行 了 研究 [168]。Harvey 提 出 了 通过 寄存 器 类 分 割 图 的 方 
法 [94]。Chaitin、Nickerson 和 Briggs 都 讨论 了 把 边 加 入 冲突 图 以 模型 化 赋值 上 的 特定 限制 [70，266，51]。 

重 写 代码 以 改进 寄存 器 分 配 的 优化 在 减 小 内 存 冲 突 中 显 出 了 它 的 有 效 性 。Carr 的 标量 替换 转换 [61， 
65] 使 用 数据 相关 性 分 析 来 寻找 可 以 被 重 写成 标量 的 基于 数组 引用 。 寄 存 器 提升 [244，296，241] 以 类 似 
的 方法 使 用 指针 数据 流 分 析 重 写 基 于 指针 的 引用 。 l 

本 章 集 中 讨论 了 局 部 和 全 局 分 配 。 一 些 作 者 审视 了 位 于 单一 块 与 整个 过 程 之 间 的 区 域 上 的 分 配 。 
Koblenz 和 Callahan 摘 述 了 Tera 计 算 机 的 编译 器 中 的 层次 着 色 分 配器 [63]。Knobe 和 Meltzer 使 用 Compass 
编译 器 的 类 似 性 质 构建 了 一 个 分 配器 ; 这 一 分 配器 构建 一 棵 控制 树 ， 并 在 这 棵 树 上 执行 两 遍 分 配 [214]。 
Proebsting 和 Fischer 开 发 了 概率 方法 [279]。 基 于 接合 的 技术 归功 于 Lueh、Adl-Tabatabai 和 Gross[247]。 


附录 A 
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A.1 概述 


ILOC 是 简单 抽象 RISC 机 器 的 线性 汇编 代码 。 本 书 所 使 用 的 ILOC 是 Rice 大 学 用 于 巨型 标量 编译 器 项 
H (MSCP) 的 中 间 表 示 的 一 个 简化 版 本 。 例 如 ， 本 书 中 的 ILOC 不 区 分 不 同类 型 的 数 ， 为 简单 起 见 ， 它 
们 假设 所 有 的 数 都 是 整数 。( 有 一 些 例子 假设 数据 项 是 64 位 的 ; 其 他 的 例子 假设 数据 项 是 32 位 的 。 从 例 
子 中 可 以 明显 看 出 这 一 差异 。) 

ILOC 抽 象 机 器 的 寄存 器 数量 不 限 。 它 有 三 地 址 、 寄 存 器 到 寄存 器 操作 ， 装 入 和 存储 操作 ， 比 较 操 
作 和 分 支 。 它 只 支持 几 个 简单 的 寻 址 模式 : 直接 、 地 址 + 偏 移 、 地 址 + 立即 以 及 立即 。 源 操作 数 在 操作 的 
发 行 周期 的 开始 读 取 。 结 果 操 作 数 在 操作 完成 的 周期 的 末端 被 定义 。 

除了 它 的 指令 集合 外 ， 机 器 的 细节 没有 明确 描述 。 大 多 数 例子 都 假设 一 台 简 单机 器 ， 带 有 一 个 功能 
单元 ， 按 ILOC 操 作出 现 的 顺序 执行 这 些 操作 。 当 使 用 其 他 模型 时 ， 我 们 再 明确 讨论 它们 。 

一 个 ILOC 程 序 是 由 指令 的 一 个 线性 列表 组 成 的 。 每 一 个 指令 之 前 可 以 附 有 一 个 标签 。 标 签 只 是 文 


AM; 它 与 指令 之 间 由 冒号 隔 开 。 根 据 习惯 ， 我 们 把 标签 的 形式 限定 为 [&-z]([e-zll[0-9]-|) 。 如 果 


某 个 指令 需要 多 个 标签 ， 那 么 我 们 在 这 一 指令 前 面 插入 一 个 只 包含 一 个 nop 的 指令 ， 并 在 这 个 nop 上 设置 
额外 的 标签 。 更 形式 地 定义 ILOC 程 序 如 下 所 示 。 


Jloc 程 序 一 ”指令 列表 
指令 列表 > 指令 
| label: 指令 
| 指令 ”指令 列表 


每 一 个 指令 包含 一 个 或 多 个 操作 。 单一 操作 指令 自身 占 一 行 ， 而 多 操作 指令 可 以 跨行 书写 。 为 了 把 
多 个 操作 组 成 单一 指令 ， 我 们 用 方 括号 把 这 些 操作 封闭 起 来 ， 并 用 分 号 把 它们 隔 开 。 更 形式 地 : 


指令 一 ”操作 
| [操作 列表 ] 
操作 列表 > 操作 
| 操作; 操作 列表 


一 个 ILOC 操 作对 应 于 在 单一 周期 被 发 行 到 一 个 功能 单元 的 机 器 级 指令 。 它 有 一 个 操作 码 ， 一 个 由 
逗号 隔 开 的 源 操 作 数 序列 和 一 个 由 逗号 隔 开 的 目标 操作 数 序列 。 源 头 与 目标 由 符号 一 隔 开 。 这 一 符号 读 
fe “HEA”. 


操作 > 一 般 操作 

| 控制 流 操作 
一 般 操作 o 操作 码 操作 数列 表 > 操作 数列 表 
操作 数列 表 . 一 操作 数 

| 


操作 数 ， 操 作 数 列表 
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操作 数 — register 
| num 
| label 


非 终结 符 Opcode (操作 码 ) 可 以 是 除 cbr、jump 或 jumpI 之 外 的 任意 ILOC 操 作 。 遗憾 的 是 ， 如 同 真 
实 的 汇编 语言 一 样 ， 操 作 码 与 它 的 操作 数 的 形式 之 间 的 关系 不 是 很 系统 。 描 述 每 一 个 操作 码 的 操作 数 形 
式 的 最 简单 方法 是 用 表格 形式 。 在 本 附录 后 面 出 现 的 表格 给 出 了 本 书 所 使 用 的 每 一 个 ILOC 操 作 码 的 操 
作 数 的 数量 和 它们 的 类 型 。 

有 三 种 类 型 的 操作 数 : register (寄存 器 )、num ( 数 ) 和 1abe1 (标签 )。 每 一 个 操作 数 的 类 型 是 
由 操作 码 和 这 一 操作 数 在 操作 中 的 位 置 所 决定 的 。 在 本 书 的 例子 中 ， 我 们 使 用 数字 (ro) 形式 和 符号 
(ri) 形式 的 寄存 器 名 字 。 数 字 是 简单 的 整数 ， 如 有 必要 的 话 可 以 是 带 符号 整数 。 我 们 总 是 在 标签 的 开 
始 放 上 一 个 1 来 使 其 类 型 一 目 了 然 。 这 是 一 个 约定 而 不 是 一 个 规则 。ILOC 模 拟 器 和 工具 应 该 把 上 述 的 任 
意 形式 的 串 当 作 一 个 可 能 的 标签 处 理 。 

大 多 数 操作 有 一 个 目标 操作 数 ; 某 些 store 操 作 有 多 个 目标 操作 数 ， 分 支 也 一 样 。 例 如 ，storeAI 有 
一 个 源 操作 数 和 两 个 目标 操作 数 。 而 源头 必须 是 一 个 寄存 器 , 且 目 标 必须 是 一 个 寄存 器 和 一 个 立即 常量 。 
因此 ，ILOC 操 作 

StoreAl r; => rj, 4 
通过 把 4 加 到 rT, 的 内 容 中 计算 一 个 地 址 ， 并 把 在 r 中 发 现 的 值 存储 到 由 这 个 地 址 所 定义 的 内 存 位 置 上。 换 
句 话说 ， 

MEMORY(rj + 4) + CONTENTS(r,) 

. 控制 流 操 作 有 稍微 不 同 的 语法 。 因 为 它们 不 定义 它们 的 目标 ， 我 们 使 用 单 箭头 -~ 而 不 是 一 书写 这 些 
控制 流 操 作 。 
| 控制 流 操作 一 cbr register — label , label 


| jump! — Jabel 
| jump — register 


第 一 个 操作 cbr 实 现 一 个 条 件 分 支 。 其 他 两 个 操作 是 无 条 件 分 支 ， 称 为 跳 转 。 


A.2. 命名 约定 


本 书 的 例子 中 的 ILOC 代 码 使 用 一 组 简单 的 命名 约定 。 
1) 变量 的 内 存 偏 移 由 在 变量 名 字 前 加 前 级 符 号 @ 来 表示 。 
2) 用 户 可 以 假定 寄存 器 供给 是 不 受 限制 的 。 这 些 寄存 器 都 是 用 简单 的 整数 形式 ， 如 在 ri 中 ， 或 用 
， 符 号 形式 ， 如 在 r: 中 ， 来 命名 的 。 

3) 寄存 器 ru 被 保留 为 指向 当前 活动 记录 的 指针 。 我 们 通常 用 rs 取代 ro， 作为 一个 提示 。 因此 ， 下 
面 的 操作 把 变量 x 的 内 容 装 入 mm 中。 


1oadAIro, @x = r; 

ro 的 使 用 揭示 x 存 储 在 当前 活动 记录 中 这 一 事实 。 当 然 ， 这 与 1oadAI r,,，e@x 一 ri 相同 。 
ILOC 的 注释 从 串 / 开 始 直到 行 尾 。 我 们 假设 这 些 都 被 扫描 器 除去 ;， 因 此， 它们 可 以 出 现 指 令 的 任意 地 方 ， 
而 且 不 用 语法 来 描述 。 
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A.3 各 种 操作 


本 书 的 例子 使 用 ILOC 操 作 的 一 个 限定 的 集合 。 在 本 附录 末尾 的 表格 给 出 本 书 中 所 用 ILOC 操 作 的 全 
集 ， 这 里 不 包括 第 7 章 中 用 于 讨论 某 些 分 支 结 构 的 分 支 语法 的 例子 。 


A.3.1 算术 
662 为 了 支持 算术 ，ILOC 提 供 一 组 基本 的 三 地 址 、 寄 存 器 到 寄存 器 操作 。 


操作 码 RRR 目标 操作 数 A 义 


add ri, rz r3 ml + rz 一 mm3 
Sub ri, rz r3 ri- m= 
mult ri, rz ra ri x rz 之 r3 
div Ti, rz r3 YL + rz => rs 


这 些 操 作 都 假设 源 操作 数 在 寄存 器 中 。 它 们 把 结果 写 回 一 个 寄存 器 中 。 任 意 寄存 器 可 以 充当 源 操 作 


数 和 目标 操作 数 。 
指定 一 个 立即 操作 数 常常 很 有 用 。 因 此， 每 一 个 算术 操作 都 有 一 个 立即 形式 的 支持 ， 对 于 非 交 换 的 
算术 操作 则 有 两 个 立即 形式 的 支持 。 
操作 码 Mak 目标 操作 数 E X 
addI Tı, Cy T2 ri + Cy => 12 
subI ` ri, C1 rz ri = C =r 
rsubI ri, Cy . M CG -nsnm 
mult! rı, C1 Yo ri XC) > Pe 
divI ri, C1 rz Ti +C 之 和 
rdivI ri, Cy T2 Cy +r S> 


这 些 形式 对 表示 特定 优化 的 结果 、 更 简明 地 写 出 例子 ， 以 及 记录 减少 对 寄存 器 的 需求 的 简明 方法 
都 很 有 用 。 Ea 

注意 ， 在 使 用 ILOC 的 实际 编译 器 中 ， 我 们 将 需要 引入 多 个 数据 类 型 。 这 将 带 来 类 型 化 的 操作 码 或 
多 态 操作 码 。 我 们 的 优先 选择 是 类 型 化 操作 码 系列 ; 整数 加 法 、 浮 点 加 法 等 等 。ILOC 起 源 的 MSCP 纺 
译 器 对 于 整数 、 单 精度 浮 点 数 、 双 精度 浮 点 数 、 复 数 以 及 指针 数据 有 不 同 的 算术 操作 ， 但 没有 字符 数据 
操作 。 


A.3.2 移 位 
663 ILOC 支 持 一 组 算术 移 位 操作 ， 向 左 移 位 和 向 右 移 位 ， 寄 存 器 形式 和 立即 形式 。 


操作 码 ORE 目标 操作 数 ” 含 义 


Tshift rı, rz rs n<r>P3 
IshiftI T1, C2 T3 Ti K C2 => 73 
rshift Ti, rz r3 Vy > r2 => 13 


rshiftI Ti, C2 T3 Ti > C2 > 3 
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A.3.3 内 存 操作 
为 了 在 内 存 和 寄存 器 之 间 移 动 值 ，ILOC 支 持 一 全 套装 人 和 存 楼 操作 。10ad 和 c1oad 操 作 把 数据 项 从 
内 存 移 到 寄存 器 。 | 
操作 码 WREE ”目标 操作 数 含 义 
load Ty rz MEMORY (r1) > r2 
loadAl ri, C1 re MEMORY (r; + C1) > r2 
1oadA0 ri, rz T3 MEMORY (r; + r2) = r3 
cload r rz 字符 Toad 
cloadAl ri, rz r3 字符 10adAI 
cloadAO fi, rz ra 字符 10adA0 


上 表 中 的 这 些 操作 在 它们 所 支持 的 寻 址 模式 上 不 同 。10ad 和 c1oad 形 式 假设 整个 地 址 是 在 单一 寄存 
器 操作 数 中 。1oadAI 和 c1oadAI 形 式 把 一 个 立即 值 加 到 寄存 器 的 内 容 中 。 我 们 称 这 些 为 地 址 立即 
(address-immediate) 操作 。1oadA0 和 ci1oadA0 形 式 在 执行 1oad 之 前 把 两 个 寄存 器 内 容 加 起 来 计算 有 效 地 
址 。 我 们 称 这 些 操作 为 地 址 偏 移 (address-offset) 操作 。 

作为 10ad 的 最 后 一 种 形式 ，ILOC 支 持 简单 的 装 入 立即 操作 。 它 从 指令 流 中 取 一 个 整数 并 把 它 放 入 
一 个 寄存 器 中 。 


操作 码 HEER 目标 操作 数 含 义 


load!l C1 rz Cl1 > T2 


完整 的 类 ILOC IR 对 于 它 所 支持 的 每 一 种 不 同类 型 的 值 都 应 该 有 一 个 装 入 立即 。 
.存储 操作 与 装 入 操作 相 匹 配 。ILOC 支 持 简单 寄存 器 形式 、 地 址 立即 形式 和 地 址 偏 移 形式 的 数字 存 
储 和 字符 存储 。 


操作 码 源 操作 数 目标 操作 数 含 义 
store ni rz ri => MEMORY (rz) 
storeAl ri rz, C1 rı > MEMORY (r; + c1) 
StoreA0 ri T2, 13 Tı > MEMORY (rz + r3) 
cstore ʻi T2 字符 store 
cstoreAl ri T2, f3 字符 storeATI 
CstoreA0 r T2, 13 字符 StoreA0 

上 表 中 没有 存储 立即 操作 。 


A.3.4 寄存 器 到 寄存 器 的 拷贝 操作 
为 了 在 寄存 器 之 间 移 动 值 而 不 经 过 内 存 ，ILOC 包 含 一 组 寄存 器 到 寄存 器 的 拷贝 操作 。 


操作 码 。 源 操作 数 目标 操作 数 含 X 
i2i r r2 rı = rz, 数值 
c2c ri r2 ri => rz 字符 
c2i n T2 将 字符 转换 为 整数 


i2c rı r2 将 整数 转换 为 字符 
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前 两 个 操作 i2i 和 c2c 把 一 个 值 从 一 个 寄存 器 拷贝 到 另 一 个 寄存 器 , 且 没 有 转换 。 前 者 适用 于 整数 值 ， 
而 后 者 适用 于 字符 。 后 两 个 操作 执行 字符 和 整数 之 间 的 转换 ， 前 者 把 字符 转换 成 它 在 ASCII 字 符 集合 的 
665) ” 序 位 ， 后 者 使 用 相应 的 ASSCII 字 符 取代 一 个 整数 。 


A.4 例子 


让 我 们 利用 如 图 A-1 所 示 的 第 1 章 的 例子 使 述 讨论 更 加 具体 。 注意 每 一 行 右 端的 注释 。 在 我 们 基于 
ILOC 的 体系 中 ， 编 译 器 前 端 自动 生成 注释 来 使 ILOC 代 码 很 适合 我 们 阅读 。 因 为 本 书 中 的 例子 的 目的 都 
主要 是 为 了 阅读 ， 所 以 我 们 注释 ILOC。 


loadAI Tarp, @w => Ty // w 在 自 ram 偏 移 为 0 处 

loadAI 2 > rz // 将 常量 2 置 入 r， 

loadAI Tarps @x => ry // x 在 偏 移 为 8 处 

loadAl rarp，@y = ry // y 在 偏 移 为 12 处 

loadAI Tarp, @z > rz // z 在 偏 移 为 16 处 

mult Twn Yo 3 ty // ww x 2 

mult tic he Sy [| tae (wx 2) x x 

mult Ths ry ST // tae (Wx 2x x) xy 
mult Ps To = Fy // w (wx 2xxxy) xz 
storeAl ry => Tarp» ÊW // 将 r, 写 回 'w' 
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图 A-1 介绍 性 例子 


然而 ， 记 住 编 译 器 并 不 读 取 这 一 注释 。 因 此 ， 在 如 下 操作 中 注释 帮助 我 们 ， 但 是 不 帮助 编译 器 确定 
标签 跳 转 的 目标 是 什么 。 


jump > riz // 返回 至 循环 顶部 


这 一 例子 假设 xw、x、y 和 z 都 被 存储 在 局 部 活动 记录 中 距 ARP 一 个 固定 的 偏 移 处 。 第 一 个 指令 是 
1oadAI 操 作 ， 即 装 入 地 址 立即 (load address-immediate) 操作 。 根 据 操作 码 表 ， 我 们 可 以 看 到 这 一 指令 
把 ra 的 内 容 与 立即 常量 e@w 结 合 起 来 ， 并 在 那个 地 址 的 内 存 中 找 回 值 ; 这 个 值 是 w。 它 把 这 个 找 回 的 值 放 
入 r, 中 。 下 一 个 指令 是 1oadI 操 作 ， 即 装 入 立即 (load immediate) 操作 。 它 把 值 2 移 到 rs 中 。( 从 效果 上 

看 ， 它 从 这 个 指令 从 流 中 把 一 个 常量 读 到 一 个 寄存 器 中 。) 指令 3 到 指令 5 把 值 x 装 入 r, 中 ， 把 y 装 入 ry 中 并 
把 z 装 入 rz 中 。 

第 6 个 指令 把 rv 和 rz 的 内 容 相 乘 ， 并 将 结果 存储 回 rv 中 。 指 令 7 把 这 个 量 与 r, 相 乘 。 指令 8 把 这 个 量 与 
ry 相 乘 ， 指 令 9 把 这 个 量 与 r: 相 乘 。 从 指令 6 到 指令 9 的 每 一 个 指令 都 把 这 个 值 累 加 到 r, 中 。 

最 后 的 指令 把 rv 的 值 保存 到 内 存 中 。 这 一 指令 使 用 storeAI ， 或 存储 地 址 立即 (store address- 
immediate) 操作 把 m 的 内 容 写 人 距 ram 偏 移 为 ew 的 内 存 位 置 。 正 如 第 1 章 所 指出 的 那样 ， 这 一 序列 评估 表 
达 式 w<-wx2xxxyxz。 


A.5 控制 流 操作 


一 般 地 ，ILOC 的 比较 操作 符 取 两 个 值 并 返回 一 个 布尔 值 。 如 果 它 的 操作 数 之 间 持 有 特殊 的 关系 ， 
那么 比较 把 目标 寄存 器 设置 为 值 true; 否则 目标 寄存 器 得 到 值 false。 
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操作 码 WREE 目标 操作 数 ae 义 
cmp-LT Ti, rz r3 true > r if ri < rz 
false > r; 否则 
cmp-LE Yi, Ye 3 tue > n ifr <r 
false > mn; Fill 
cmp-EQ Tis T2 T3 tue > n ifr = re 
false > r ”否则 
cmp-GE Ti, T2 T3 tue > nh if mn >r: 
false > n 否则 
cmp.GT Ti, rz T3 true > nh} ifr) >r 
false > r FMI 
cmp-NE Ti, rz r3 true > r3 if ry Ær? 


false > r, 否则 


可 以 通过 使 用 条 件 分 支 操作 把 比较 的 结果 用 于 改变 控制 流 。 


操作 码 ” 源 操作 数 目标 操作 数 含 义 


cbr ri lis l2 lı > ec if r, = true 
l2 一 PC if r; = false 


条 件 分 支 操作 取 一 个 布尔 值 作为 它 的 参数 ， 并 控制 转换 到 两 个 目标 标签 中 的 一 个 。 如 果 这 一 布尔 值 
为 tue， 那 么 选择 第 一 个 标签 ;如果 这 一 布尔 值 为 false， 选 择 第 二 个 标签 。 因 为 两 个 分 支 目标 不 是 由 指 
令 定义 的 ， 所 以 我 们 可 以 稍微 改变 一 下 语法 。 我 们 用 单 箭头 一 写 出 这 一 分 支 ， 而 不 是 使 用 箭头 一 。 

在 条 件 分 支 使 用 两 个 标签 有 两 个 优势 。 第 一 ， 代 码 在 某 种 程度 上 更 精确 。 在 某 种 状态 下 ， 只 带 有 一 
个 标签 的 条 件 分 支 可 能 需要 一 个 后 继 跳 转 。 两 个 标签 分 支 把 这 一 相同 的 组 合 编码 到 单一 操作 中 。 第 二 ， 
代码 更 容易 处 理 。 单 一 标签 分 支 依赖 于 代码 布局 。 它 隐 合 地 把 包含 这 一 分 支 的 块 与 落下 路 径 上 的 块 连结 
起 来 。 使 用 单一 标签 分 支 ， 编 译 器 必须 保留 这 些 关 系 。 

两 标签 条 件 分 支 使 得 这 一 隐 式 关联 变 成 显 式 的 ， 并 消除 任意 可 能 的 位 置 相关 性 。 这 就 使 编译 器 可 以 
自由 地 以 它 所 希望 的 最 小 化 执行 时 间 的 顺序 布局 分 支 和 块 。 最 后 ， 它 简化 控制 流 图 的 结构 。 


A.5.1 其 他 比较 和 分 支 语法 


在 第 7 章 ， 我们 讨论 了 当 比 较 返 回 一 个 被 写 入 到 条 件 代 码 寄 存 器 中 的 值 时 所 发 生 的 事情 。 这 样 的 条 
件 代 码 只 能 被 更 复杂 的 条 件 分 支 指令 来 解释 。 为 了 讨论 这 一 机 制 ， 我 们 使 用 另外 一 组 比较 和 条 件 分 支 
操作 。 


操作 码 ” 源 操作 数 目标 操作 数 & 义 

comp Tis r2 CC1 Bcc) 

cbr_LT cc; lis 12 11 一 PC if cc = LT 
l2 一 PC 否则 

cbr_LE ccl Tis l2 li Pc if cc; = LE 
l2 一 PC 否则 

cbr_EQ cc} li, le lı 一 Pc if cc; = EQ 
12 > ec SR 


cbr.GE CC; lis le lı 一 PC if cc} = GE 


D 
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( 续 ) 
操作 码 ” 源 操作 数 目标 操作 数 含 x 
le —> PC 否则 
cbr_GT cc) lis le Ti — PC if cc) = GT 
l2 一 PC 否则 
cbr_NE cc, li, le lı > PC if cc = NE 
l2 一 PC 否则 


这 里 ， 比 较 操 作 符 comp 取 两 个 值 ， 并 适当 地 设置 条 件 代码 。 我 们 总 是 指定 comp 的 目标 为 写成 cc 的 
条 件 代 码 寄存 器 。 相 应 的 条 件 分 支 有 6 个 变形 ， 其 中 每 一 个 都 对 应 一 个 比较 结果 


A5.2 Bee 


ILOC 包 含 两 种 跳 转 操作 形式 。 凡 乎 所 有 例子 中 使 用 的 形式 都 是 把 控制 转换 成 文字 标签 的 立即 跳 转 。 
第 二 种 形式 是 跳 转 到 寄存 器 操作 ， 它 取 单 一 寄存 器 操作 数 。 它 把 寄存 器 的 内 容 解释 为 一 个 运行 时 地 址 ， 
并 把 控制 转换 到 那个 地 址 上 。 


操作 码 源 操 作 数 目标 操作 数 含 义 


jumpI 无 li lı Pc 
jump 无 r rı 一 PC 


跳 转 到 寄存 器 形式 是 一 个 歧义 控制 流转 换 。 一 旦 它 被 生成 ， 编 译 器 也 许 不 能 够 推断 出 这 一 跳 转 的 目 
标 标签 的 正确 集合 。 因 为 这 一 原因 ， 编 译 器 应 该 尽量 避免 使 用 到 寄存 器 的 跳 转 。 

有 时， 避免 使 用 到 寄存 器 的 跳 转 需要 非常 复杂 的 处 理 ， 以 至 于 到 寄存 器 的 跳 转 变 得 更 具 吸 引力 ， 尽 
管 它 存 在 问题 。 例 如 ，FORTRAN 包 含 一 个 跳 转 到 标签 变量 的 结构 ;使 用 立即 分 支 实现 这 一 结构 将 需要 
类 似 于 选择 语句 的 逻辑 : 一 系列 立即 分 支 以 及 把 标签 变量 的 运行 时 值 与 可 能 标签 集 匹 配 的 代码 。 在 这 样 
的 环境 下 ， 编 译 器 有 可 能 会 使 用 到 寄存 器 的 跳 转 。 

为 了 减 小 来 自 跳 转 到 寄存 器 操作 的 信息 损失 ， ILOC 包 合 一 个 让 编译 器 记录 号 转 到 寄存 器 的 可 能 标 
签 集合 的 伪 操 作 。tb1 操 作 有 两 个 参数 ， 一 个 寄存 器 和 一 个 立即 标签 。 


操作 码 源 操 作 数 ”目标 操作 数 含 义 
tb] Ty, le 一 ri might hold 12 


tb1 操 作 只 能 出 现在 jump 操 作 之 后 。 编 译 器 把 一 个 或 多 个 tb1 的 集合 解释 成 对 寄存 器 所 有 可 能 标签 
的 命名 。 因此， 下 面 的 序列 表明 跳 转 的 目标 是 L01、L03、L05 或 L08 中 的 一 个 。 

jump >ñ 

tbl r, LOI 

tbl ri, L03 

tb] rj, LOS 

tbl ri LO8 


A.6 SSA 形 式 的 表示 
当 编 译 器 根据 程序 的 人 R 版 本 构造 它 的 SSA 形 式 时 ， 它 需要 一 个 表示 9 函数 的 方法 。 在 ILOC 中 ， 书 写 
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4 函数 的 自然 的 方法 是 把 它 作为 一 个 ILOC 操 作 。 因 此 ， 我 们 有 时 候 将 把 9 函数 mm 一 bg (r, ry, rn) 写成 
Phi m,，ri，nre=rs。 因 为 SSA 形 式 的 性 质 ，phi 操 作 可 能 取 任意 多 个 源 操 作 数 。 它 总 是 定义 单一 目标 。 








ILOC 操 作 码 概括 
操作 码 。 源 操 作 数 ”目标 操作 数 含 义 
nop 无 无 使 用 其 作为 占 位 符 
add rı, T2 ra ri +rz 之 T3 
addI ri, Cl ry Ttc >T 
sub ri, rz ra nN-r=r 
subI Ti, C1 T2 rı- Ci > r2 
mult rı, T2 r3 YT] X T2 => 13 
multI Ti, C1 rz rı XC) > Pe 
div Ti, T2 m3 二 T 和 rT 
divI Ti, C1 rz Ti + Ci = rz 
lshift Ti, T2 r3 rir=r 
IshiftI Ti, C2 ry ri & C2 S73 
rshift Ti, T2 r3 Pm ors 
rshiftl ri, C2 ra Yi > Cory 
and Ti, T2 T3 TLAT2 => 3 
andiI rı, C2 T3 TAC 
or ri, V2 T3 YT) V le > 13 
orl Ti, C2 3 Ty V Co => Tr 
xor Ti, T2 r3 rı XOF 2 > 13 
xorI Ti, C2 r3 Tı XOT Co > 13 
loadI Ci r2 Ci => Pe 
load Ti rz MEMORY (rı) > rz 
loadAl Ti, C1 rz MEMORY (ri + C;) > r2 
1oadA0 rı, rz r3 MEMORY (ri + r2) > r3 
cload ri T2 字符 10ad 
cloadAl ri, rz T3 字符 10adAI 
cloadA0 Ti, V2 T3 字符 10adA0 
store r rz rı > MEMORY (rz) 
storeAl Ti T2, C1 rı => MEMORY (rz + c1) 
storeA0 Ti o 3 Tı > MEMORY (rz + r3) 
cstore ni re 字符 store 
cstoreAl ni r2, 03 字符 storeAI 
cstoreA0 ry rz r3 ”字符 storeA0 
121 ri rz T1 => rz 
c2c Tr T2 r= 
c2i r r2 将 字符 转换 为 整数 
i2c ri r2 将 整数 转换 为 字符 
ILOC 控 制 流 操作 
REB WBA ”目标 操作 数 EX 
cbr ri 11, 12 rı = true > 1, 一 PC 
rı = false > 12 一 PC 
jump! 无 li 1 — PC 
jump 无 ri ri— PC 
cmp-LT T1, rz r3 ri < r; > true > rs 


(GW, false 一 r3) 
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(#8) 
操作 码 源 操 作 数 目标 操作 数 含义 
cmp_LE ri re r3 rı < m > true > r; 
cmp.£Q V1, rz r3 ri = m > true > r3 
cmp.NE V1, r2 ra ry Æ re > true > r3 
cmp-GE Ti, r2 r3 rı > rm > true > r3 
cmp-GT ri, rz rs ri > r > true > rs 
tbl ri, lz 一 rı might hold 12 

ILOC 另 一 种 分 支 语法 

操作 码 。 源 操 作 数 ”目标 操作 数 含 义 

comp fris Ty Ce Ecc, 

cbr_LT cc) Ti, Te cc) = LT > 1; + PC 

(否则 12 一 PC) 

cbr.LE cc; li, le cc} = LE>1, 3 PC 
cbr_EQ CC} li, 12 cci = EQ > 1, 一 PC 
cbr_GE cel li, le ccl 一 GE 之 11 一 PC 
cbr_GT cci LEPA 12 cci = GT 31, > PC 
cbr_NE cci li, le ccy =NE > 1; 3 PC 





MRA 


B.1 概述 


精心 制作 成 功 的 编译 器 需要 注意 很 多 细节 。 本 附录 揭示 在 编译 器 的 设计 和 实现 中 引发 的 一 些 算法 问 
题 。 在 大 多 数 情况 下 ， 这 些 细 节 应 该 不 同 于 正文 中 的 相关 讨论 。 我 们 把 它们 收集 起 来 形成 本 附录 ， 在 此 
它们 会 得 到 必要 的 考虑 。 

本 附录 集中 讨论 支持 编译 的 基础 结构 。 在 设计 和 实现 这 些 基础 结构 中 引发 很 多 工程 问题 ， 编译 器 设 
计 者 解决 这 些 问 题 的 行为 方式 对 结果 编译 器 的 速度 、 易 扩展 性 以 及 维护 编译 器 都 有 着 很 大 的 影响 。 作 为 
这 些 问 题 引出 的 一 个 例子 ， 编 译 器 无 法 知道 它 的 输入 代码 的 大 小 ， 直 到 它 读 完 它们 为 止 ; 因此 ， 前 端 必 
须 被 设计 成 可 以 适度 扩展 它 的 数据 结构 的 大 小 以 适应 较 大 的 输入 文件 。 然 而 ， 作 为 一 个 推论 ， 在 调用 紧 
跟前 端的 遍 之 时 ， 编 译 器 应 该 知道 它 的 大 部 分 内 部 数据 结构 所 需 的 大 小 。 生 成 一 个 带 有 10 000 个 名 字 的 
IR 程 序 后 ， 编 译 器 在 第 二 遍 的 时 候 就 不 应 该 使 用 大 小 为 1024 个 名 字 的 符号 表 。 包 含 IR 的 任意 文件 都 应 该 
从 主要 数据 结构 的 粗略 大 小 的 描述 开始 。 

同样 地 ， 编 译 器 的 后 期 遍 可 以 假设 传 给 它们 的 IR 程 序 是 由 编译 器 生成 的 。 虽 然 这 些 遍 应 该 做 完整 的 
错误 检查 工作 ， 实 现 者 无 需 像 前 端 那样 花 太 多 的 时 间 解 释 错 误 ， 并 设法 改正 这 些 错误 。 一 般 的 策略 是 构 


建 对 蕉 程序 做 全 面 检查 ， 并 可 以 为 调试 目的 插入 信息 的 确认 遍 ， 而 更 少 地 依赖 于 错误 检查 及 在 不 调试 编 


译 器 时 报告 错误 。 然 而 ， 整 个 过 程 中 ， 编 译 器 设计 者 应 该 记 住 他 们 是 最 有 可 能 去 检查 遍 之 间 的 代码 的 人 ， 
花费 精力 和 时 间 去 使 及 程序 的 形式 更 容易 阅读 通常 会 回报 那些 对 此 投入 精力 和 时 间 的 人 。 


B.2 表示 集合 


编译 的 很 多 问题 都 可 以 用 涉及 集合 的 项 来 形式 化 。 这 些 问题 出 现 于 本 书 的 很 多 地 方 ， 包 括 子 集 构造 
法 (第 2 章 )、LR(1) 项 目的 规范 集合 的 构造 法 (第 3 章 )、 数 据 流 分 析 (第 8 章 和 第 9 章 ) 以 及 诸如 列表 调 
度 中 就 绪 队 列 的 工作 表 (第 12 章 )。 在 每 一 个 上 下 文 ， 编 译 器 设计 者 必须 选择 一 个 适当 的 集合 表示 。 在 
很 多 情况 下 ,算法 的 有 效 性 依赖 于 集合 表示 的 细心 选择 。( 例如， 在 支配 者 计算 中 的 dom 数 据 结构 表示 使 
用 一 个 紧凑 的 数组 表示 所 有 的 支配 者 集合 及 立即 支配 者 。) 

构建 编译 器 与 构建 其 他 种 类 系统 软件 ， 如 操作 系统 ， 之 间 的 基本 差异 是 编译 中 的 很 多 问题 可 以 脱 机 
解决 。 例 如 ，13.3.2 节 中 所 描述 的 寄存 器 分 配 的 自 底 向 上 局 部 算法 是 于 20 世 纪 50 年 代 中 期 为 原始 的 
FORTRAN 编 译 器 提出 的 。 它 是 以 Belady 的 MIN 算 法 而 著称 的 脱 机 页 替换 算法 ， 长 期 以 来 这 一 算法 被 用 
作 评 判 在 线 页 替换 算法 有 效 性 的 标准 。 在 操作 系统 中 ， 这 一 算法 只 是 一 个 学 术 意义 上 的 算法 ， 因 为 它 是 
一 个 脱 机 算法 。 因 为 操作 系统 不 知道 将 要 需要 哪些 页 ， 它 无 法 使 用 脱 机 算法 。 另 一 方面 ， 脱 机 算法 对 编 
译 器 是 实用 的 ， 因 为 编译 器 可 以 在 做 出 决定 之 前 检查 整个 块 。 

编译 的 脱 机 性 质 允 许 编译 器 设计 者 使 用 范围 较 宽 的 集合 表示 。 现 已 提出 有 很 多 集合 表示 。 特 别 地 ， 
脱 机 计算 通常 使 我 们 把 一 个 集合 5 的 元 素 限 制 到 一 个 固定 大 小 的 全 域 U 内 (5CU)。 反 过 来 ,这 又 使 我 们 
可 以 使 用 比 在 动态 发 现 U 的 大 小 的 在 线 状况 所 适用 的 表示 更 有 效 的 集合 表示 。 
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通用 的 集合 操作 包括 member、insert、delete、 clear, select, cardinality. forall. copy. 
compare、union、intersect、difference 和 complement。 特 定 的 应 用 一 般 只 使 用 这 些 操作 中 的 一 小 部 
分 。 各 个 集合 操作 的 代价 依赖 于 所 选 的 特定 表示 。 在 为 特定 应 用 选择 高 效 表示 时 ， 重 要 的 是 要 考虑 每 一 
类 操作 的 使 用 频率 。 要 考虑 的 其 他 因素 包括 集合 表示 的 内 存 需 求 和 相对 于 已 的 $ 的 期 待 稀疏 性 。 

本 节 的 其 余部 分 集中 于 讨论 用 于 编译 器 的 三 个 高 效 的 集合 表示 : 有 序 链表 、 位 向 量 和 稀疏 集 。 


B.2.1 把 集合 表示 成 有 序 表 


在 每 一 个 集合 都 很 小 的 情况 下 ， 使 用 简单 的 链表 表示 有 时 候 很 有 意义 。 对 于 集合 ?3， 这 一 表示 是 由 
一 个 链表 和 指向 这 个 列表 的 第 一 个 元 素 的 指针 组 成 的 。 列 表 中 的 每 一 个 结 点 包含 一 个 S 中 元 素 的 表示 和 
一 个 指向 列表 中 下 一 个 元 素 的 指针 。 列 表 中 最 后 一 个 结 点 的 指针 指向 一 个 表示 列表 结尾 的 标准 值 。 使 用 
链表 表示 ， 实 现 可 以 在 元 素 (RA) 上 引入 一 个 硕 序 来 创建 一 个 有 序列 表 。 例 如 ， 集 合 5= {i,j, k}, 
i<j<k 的 有 序 链接 表 可 以 有 如 下 形式 : 


元 素 按 升 序 保存 。5 的 表示 的 大 小 与 5 中 元 素 的 个 数 成 正比 , 而 不 与 U0 的 大 小 成 正比 。 如 果 |SI 比 UI 小 很 多 ， 
那么 仅 表示 存在 于 5 中 的 元 素 的 节约 可 以 大 大 抵消 每 一 个 元 素 中 的 指针 所 带 来 的 额外 代价 。 

列表 表示 特别 灵活 。 因 为 在 列表 中 没有 依赖 于 U 的 大 小 或 依赖 于 5 的 大 小 的 工作 ， 它 可 以 用 于 编译 器 
发 现 U 或 5 或 两 者 的 情况 ， 例 如 图 着 色 寄 存 器 分 配器 的 活性 区 域 寻 找 部 分 。 

图 B-1 中 的 表格 给 出 使 用 这 一 表示 的 通用 集合 操作 的 新 近 复 杂 度 。 有 序 链表 上 的 大 多 数 集合 操作 的 
复杂 度 是 O(|SD ， 因 为 为 了 执行 这 些 操 作 ， 有 必要 人 遍历 链表 。 如 果 释 放 存储 单元 操作 无 需 遍历 列表 就 可 
以 释放 各 个 元 素 的 结 点 ， 如 在 某 些 垃圾 收集 系统 或 基于 实 存 块 的 系统 中 那样 ， 那 么 cJear 花 费 常量 时 间 。 


操 作 有 序 链表 稀疏 集 
member o(s) o(1) 
insert O(S) O() 
delete oldSp oi) 
clear Ql) O(1) 
select O(1) OO) 
cardinality OS) OD 


forall Os) . o(s) 
copy ocs) oiis) 
compare O(|S)) o(s) 
union ols) O(|S|) 
intersect oiis) O((S)) 
difference ods) os) 
complement 一 OU 





图 B-1 集合 操作 的 渐进 时 间 复 杂 度 


当 全 域 未 知 时 ， 这 一 想法 的 一 个 变形 很 有 意义 ， 集 合 可 以 合理 地 增 大 ， 如 在 冲突 图 构造 法 中 那样 
(参见 第 13 章 )。 使 每 个 结 点 保存 固定 数量 (大 于 1 个 ) 集合 元 素 将 显著 减 小 空间 和 时 间 上 的 负担 。 每 一 
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个 结 点 保存 k 个 元 素 ， 构 建 " 个 元 素 的 集合 需要 [mb] 次 分 配 和 [mc]+1I 个 指针 ， 而 单一 元 素 结 点 集合 将 需 
要 7 次 分 配 和 m+ 1 个 指针 。 这 一 设计 保留 了 列表 表示 的 易 扩 展 性 ， 又 减 小 了 空间 负担 。 与 每 一 个 结 点 对 
` 应 于 一 个 元 素 的 集合 相 比 ， 插 入 和 删除 要 移动 更 多 的 数据 。 然 而 ， 它 们 的 渐进 复杂 度 仍然 是 O(|S|)。9 

用 于 支配 计算 (参见 9.3.2 节 ) 中 的 dom 数 组 ， 把 列表 表示 巧妙 地 运用 到 一 个 特殊 的 情况 。 特 别 地 ， 
编译 器 知道 全 域 的 大 小 和 集合 的 数量 。 使 用 有 序 集合 ， 编 译 器 还 知道 ， 如 果 eE51 且 eE5,， 那 么 51 中 e 之 后 
的 每 一 个 元 素 也 都 在 ,中 这 一 特殊 性 质 。 因 此 ， 它 们 可 以 共享 从 e 开 始 的 元 素 。 通 过 使 用 数组 表示 ， 元 素 
名 字 可 以 用 作 指针 。 这 使 "个 元 素 的 单一 数组 把 "个 稀 栈 集合 表示 成 有 序列 表 。 这 还 为 那些 集合 生成 快速 
插入 操作 符 。 


B.2.2 把 集合 表示 成 位 向 量 


编译 器 设计 者 常常 使 用 位 向 量 来 表示 集合， 特别 是 那些 用 于 数据 流 分 析 (参见 8.6 节 和 9.2 节 ) 中 的 
集合 。 对 于 一 个 有 界 爹 域 U， 包 含 于 U 的 集合 S(SCU) 可 以 用 长 度 |U| 的 位 向 量 表示 ， 这 一 表示 被 称 为 $ 
的 特征 向 量 (characteristic vector)。 对 于 每 一 个 ieU，0 < i<|U|， 如 果 iES， 特 征 向 量 的 第 i 个 元 素 等 于 1。 
否则 它 等 了 0。 例 如， 包含 于 0 的 集合 5 一 {i，j， 人 ，i<j<k 的 特征 向 量 有 如 下 形式 : 


0 il i ih ji j ja kl k kel [UF 
el- folifol~ fofsfo] -Je el-e] 
位 向 量 表示 总 是 分 配 足够 大 的 空间 以 表示 所 有 忆 7 中 的 元 素 ; 因此 ， 这 一 表示 只 能 用 于 已 是 已 知 的 应 用 中 ， 
也 就 是 一 个 脱 机 应 用 。 
图 B-1 中 的 表格 列 出 使 用 这 一 表示 的 通用 集合 操作 的 渐进 复杂 度 。 尽 管 很 多 操作 是 O(JUI)， 但 是 ， 如 
果 U 较 小 ， 它 们 仍然 有 较 高 的 效率 。 一 个 字 可 以 持 有 很 多 元 素 ; 相 比 每 一 个 元 素 需要 一 个 字 的 表示 ， 这 
一 表示 可 以 得 到 常量 倍 的 改进 。 因 此 ， 例 如 ， 使 用 32 位 大 小 的 字 ，32 个 或 少 于 32 个 元 素 的 任意 全 域 有 单 
一 字 表示 。 : 
这 一 表示 的 紧 资 性 改进 操作 速度 。 使 用 单一 字 和 集合 ， 很 多 集合 操作 变 成 单一 机 器 指令 ; 例如 ， 
union 变 成 一 个 逻辑 或 操作 ， 而 intersection 则 变 成 一 个 逻辑 与 操作 。 即 使 这 一 集合 需要 多 个 字 表 示 ， 
很 多 集合 操作 的 执行 所 需 的 机 器 指令 的 数量 也 可 以 按 机 器 的 字 的 大 小 减 小 。 


B.2.3 表示 稀疏 集合 


， 对 于 固定 的 全 域 U 和 包含 于 V 的 集合 9$，3 是 稀 朴 集 ， 如 果 |3| 远 小 于 ||。 在 编译 中 所 遇 到 的 某 些 集合 
是 稀疏 的 。 例 如 ， 用 于 寄存 器 分 配 的 LIVEOUT 集 合 是 典型 的 稀 玻 集合 。 编 译 器 设计 者 常常 使 用 位 向 量 
来 表示 这 样 的 集合 ， 这 归 因 于 它们 在 时 间 和 空间 上 的 高 效 性 。 然 而 ， 只 要 有 是 够 的 稀疏 性 ， 那 么 更 高 效 
的 时 间 表 示 是 可 能 的 ， 特 别 是 当 大 部 分 操作 的 时 间 都 在 O(1) ROIS 时 更 是 如 此 。 相 对 而 言 ， 位 向 量 集 
合 在 这 些 操作 上 花 的 时 间 要 么 是 O(1) 要 么 是 O(|U)，。 如 果 | 可 | 与 ISI 的 比 大 于 一 个 字 的 大 小 ， 那 么 位 向 量 可 
能 是 效率 较 低 的 选择 。 

具有 这 些 性 质 的 稀 玻 集合 表示 ， 使 用 长 度 为 |0I 的 两 个 向 量 和 一 个 标量 来 表示 这 个 集合 。 第 一 个 向 量 
Spar5e 持 有 这 一 集合 的 稀疏 表示 ; 第 二 个 向 量 dense 持 有 这 一 集合 的 密集 表示 。 标 量 next 持 有 dense 中 
这 一 集合 的 下 一 个 新 元 素 可 以 被 插入 的 位 置 下 标 。 当 然 ，next 也 持 有 这 一 集合 的 势 。 

当 创 建 一 个 稀 醇 集 时 ， 这 两 个 向 量 不 需要 初始 化 ， 集合 成员 测试 保证 处 理 时 每 一 入 口 的 有 效 性 。 
cJear 操 作 简 单 地 把 next 设置 回 它 的 初始 值 0。 为 了 把 一 个 新 元 素 后 V 加 入 8 中 ， 代 码 (1) 把 ;存储 到 


全 ”对 于 单一 的 链 玫 ,在 列表 的 前 面 而 不 是 后 面 保存 额外 的 空间 可 以 简化 jnsert 和 delete。 
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dense 中 next 的 位 置 上 ; (2) 把 next 的 值 存储 在 sparse 中 第 i 个 位 置 上 ; (3) 递增 next， 使 其 成 为 下 一 
个 元 素 在 dense 中 的 插入 位 置 的 索引 。 

如 果 我 们 从 一 个 空 稀 醇 集合 5S 开始，. 且 按 i、i、k 的 顺序 增加 元 素 ， 其 中 i<j<kx， 那 么 这 一 集合 的 形 
式 如 下 : 


0 i j k [UHI 
sose | ~ al- Jo] [2] -] | 


dense 





注意 ， 稀疏 集 表示 需要 足够 的 空间 以 表示 整个 U。 因此 ， 它 只 能 用 于 编译 器 知道 U 的 大 小 的 脱 机 状况 。 
因为 sparse 和 dense 中 的 每 一 个 元 素 i 的 有 效 入 口 必须 互相 指向 对 方 ， 所 以 可 以 使 用 下 面 的 测试 来 确 
定 成 员 关 系 。 i 


0< sparselil <next and  dense(sparse{i]] =i 


图 B-1 中 的 表格 列 出 通用 集合 操作 的 渐进 复杂 庆 。 因 为 这 一 方案 包含 集合 的 稀疏 表示 和 密集 表示 ， 
所 以 这 一 方案 具有 两 者 的 某 些 优势 。 集 合 中 的 各 个 元 素 可 以 通过 sparse 在 时 间 O(1) 内 得 到 处 理 ， 而 必 
须 遍 历 这 一 集合 的 集合 操作 可 以 使 用 dense 得 到 O(]S) 的 复杂 度 。 

当 在 位 向 量 和 稀疏 集 表 示 之 间 进 行 选择 时 ， 应 该 既 考 虑 空间 又 考虑 时 间 的 复杂 度 问 题 。 稀 朴 集 表示 
需要 两 个 长 度 为 |U| 的 向 量 和 一 个 标量 。 相 反 ， 位 向 量 表示 需要 一 个 长 度 为 |U| 的 向 量 。 如 图 B-1 所 示 ， 稀 
疏 集 表示 在 渐进 时 间 复 杂 度 方面 优 于 位 向 量 表示 。 然 而 ， 因 为 位 向 量 集合 操作 的 高 效 实现 的 可 能 性 ， 所 
以 在 3 不 是 稀 朴 的 情况 下 位 向 量 是 首选 。 当 在 这 两 个 表示 之 间 选 择 时 ， 重 要 的 是 要 考虑 被 表示 集合 的 稀 
疏 性 和 被 使 用 的 集合 操作 的 相对 频率 。 


B.3 实现 中 间 表 示 


在 选择 了 特定 类 型 的 了 之 后 ， 编 译 器 设计 者 必须 决定 如 何 实现 它 。 乍 看 起 来 ， 这 一 选择 似乎 很 显然 。 
使 用 指针 和 堆 分 配 数据 结构 ， DAG 很 容易 被 表示 成 结 点 和 边 。 四 元 组 很 自然 地 被 表示 成 一 个 4x Kk 的 数组 。 
然而 ， 对 于 和 集合， 选择 最 好 的 实现 需要 对 编译 器 如 何 使 用 这 一 数据 结构 有 更 深 的 理解 。 


B.3.1 图 式 中 间 表 示 


如 第 5 章 所 讨论 的 那样 ， 编 译 器 使 用 若干 图 式 IR 形 式 。 使 图 的 实现 适合 编译 器 的 需求 可 以 改进 编译 
器 的 时 间 和 空间 效率 。 本 节 描述 使 用 树 和 图 所 发 引发 的 一 些 问题 。 

1. 树 的 表示 

在 大 多 数 语言 中 ， 树 的 自然 表示 是 一 组 由 指针 连结 起 来 的 结 点 。 在 编译 器 构建 树 的 时 候 ， 典 型 的 实 
现 是 按 需 求 分 配 结 点 。 树 可 能 包含 不 同 尺寸 的 结 点 ， 例 如 改变 结 点 的 子 结 点 的 数量 及 某 些 数据 域 。 另 一 
种 选择 是 使 用 单一 种 类 的 结 点 构建 树 ， 把 每 个 结 点 分 配 成 适合 最 大 可 能 结 点 的 结 点 。 

表示 相同 的 树 的 另 一 种 方法 是 结 点 结构 的 数组 。 在 这 一 表示 中 ， 指 针 被 整数 索引 所 取代 ， 而 且 基 于 
指针 的 引用 变 成 标准 的 数组 和 结构 引用 。 这 一 实现 构建 单一 尺寸 结 点 ， 而 其 他 部 分 则 与 基于 指针 的 实现 
类 似 。 
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这 些 方案 各 有 优 缺 点 。 

。 指 针 方案 处 理 任 意 大 小 的 AST。 当 AST 的 大 小 超过 最 初 分 配 的 尺寸 时 ， 数组 方案 需要 扩展 数组 的 
代码 。 

。 指 针 方案 需要 为 每 一 个 结 点 做 一 次 分 配 ， 而 数组 方案 只 是 递增 记 数 器 (除非 它 必须 扩展 数组 )。 像 
基于 实 存 块 的 分 配 (参见 第 6 章 中 的 栏 外 标题 : 基于 实 存 块 的 分 配 ) 那样 ， 某 些 技术 可 以 降低 分 配 
和 回收 的 代价 。 

。 指 针 方案 有 完全 依赖 于 运行 时 分 配器 行为 的 引用 局 部 性 。 数 组 技术 使 用 连续 内 存 位 置 。 特 定 系统 
可 能 更 适合 特定 的 方案 。 

。 指 针 方 案 更 难 优化 ， 因 为 对 指针 密集 代码 的 静态 分 析 的 质量 相当 不 理想 。 相 反 ， 为 密集 的 线性 代 
数 代码 而 开发 的 很 多 优化 可 以 运用 于 数组 方案 。 当 编译 器 被 编译 时 ， 这 些 优化 可 能 产生 比 指针 方 
案 代码 更 快 的 数组 方案 代码 。 

“指针 方案 与 数组 实现 相 比 可 能 很 难 调 试 。 程 序 员 似乎 发 现 数组 索引 比 内 存 寻 址 更 直接 。 

。 如 果 AST 必 须 被 写 到 外 部 媒介 中 ， 那 么 指针 方案 需要 编码 指针 的 方法 。 这 大 概 包 含 按 指针 来 遍历 
各 结 点 。 数 组 系统 使 用 相对 于 数组 开始 位 置 的 偏 移 ， 所 以 不 需要 进行 翻译 。 在 很 多 系统 上 ， 这 可 
以 通过 大 的 模块 WO 操作 来 实现 。 

还 存在 其 他 很 多 衡量 的 尺度 。 每 一 种 都 要 在 上 下 文中 来 评估 。 

2. 把 树 上 映射 到 二 叉 树 

抽象 语法 树 的 一 个 直截了当 的 实现 也 许 支持 带 不 同 子 结 点 的 结 点 。 例 如 ， 典 型 的 for 循 环 头 部 

for i=l to n by 2 


在 AST 中 可 能 是 如 图 B-2a) 所 示 带 5 个 子 结 点 的 结 点 。 其 中 ， 标 签 为 body 的 结 点 表示 for 循 环 体 子 树 。 


for for 一 一 一 next 语句 … 


| 


i—1—n— 2 — body 


i 1 n 2 body flail p? 


a) b) 
表示 for 循 环 


全 个 
OON Oe 
OOD C COC 


c) d) 
表示 一 个 更 复杂 的 树 


图 B-2 把 任意 树 映射 到 二 叉 树 


对 于 某 些 结构 ， 无 法 固定 子 结 点 的 数量 。 为 了 表示 一 个 过 程 调用 ， AsT 必 须 或 者 基于 参数 的 数量 调 
整 分 配 结 点 ， 或 者 使 用 带 有 参数 列表 的 单一 子 结 点 。 前 者 的 方法 复杂 化 遍历 AST 的 所 有 代码 ; TERT 
的 结 点 必须 保存 指示 有 多 少 个 子 结 点 的 数字 , 而 遍历 必须 包含 读 取 这 些 数字 并 相应 修改 遍历 行为 的 代码 。 
后 者 的 方法 把 AST 的 实现 从 它 对 源头 的 强大 的 依附 中 分 离 出 来 ， 而 使 用 列表 这 种 容易 理解 的 结构 来 表示 
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固定 参数 结 点 不 适合 的 那些 地 方 。 

为 了 简化 树 的 实现 ， 编 译 器 设计 者 可 以 进一步 采用 这 种 形式 与 含义 的 分 离 。 可 以 把 任意 的 树 映 射 到 二 
叉 树 上 ， 其 中 二 又 树 的 每 一 个 结 点 都 刚好 有 两 个 子 结 点 。 在 这 一 映射 中 ， 左 子 结 点 指针 指向 最 左边 的 子 结 
点 ， 右 子 结 点 指针 指向 当前 水 平 上 的 下 一 个 兄弟 结 点 。 图 B-2b) 给 出 映射 到 二 又 树 的 带 5 个 子 结 点 的 for 结 
点 。 因 为 每 一 个 结 点 都 是 二 又 的 ， 所 以 这 棵 树 在 每 一 个 叶 结 点 处 有 空 指针 。 它 还 在 for 结 点 有 一 个 兄弟 指 
针 ; 在 左 侧 的 版 本 中 。 这 一 指针 出 现在 for 结 点 的 父 结 点 中 。 此 图 B-2c) 和 图 B-2d) 给 出 更 复杂 的 例子 。 

使 用 二 又 树 在 树 中 引入 额外 的 空 指 针 ， 如 这 两 个 例子 所 示 。 但 它 以 若干 方式 简化 实现 。 内 存 分 配 可 
以 简单 地 完成 ， 使 用 基于 实 存 块 的 分 配器 或 定制 分 配器 。 编 译 器 设计 者 也 可 以 把 树 作为 结构 数组 实现 。 
处 理 二 又 树 的 代码 在 某 种 程度 上 比 处 理 可 变数 量 结 点 树 的 代码 更 简单 。 

3. 表示 任意 图 

编译 器 必须 表示 的 若干 结构 是 一 般 的 图 而 不 是 树 。 其 例子 包括 控制 流 图 和 数据 优先 图 。 一 个 简单 实现 可 
以 使 用 堆 分 配 结 点 ， 并 用 指针 来 表示 边 。 图 B-3 左 边 给 出 一 个 简单 的 cfg。 显 然 ， 它 需要 三 个 结 点 。 边 带 来 困 
难 ; 每 个 结 点 需要 多 少 个 人 边 和 出 边 ? 每 个 结 点 可 以 维护 一 个 出 边 列表 ; 这 导致 此 图 右边 所 示 的 一 个 实现 。 


entry 





控制 流 图 实现 
图 B-3 控制 流 图 示例 


在 这 一 图 表 中 ， 长 方形 表示 结 点 。 椭 圆 表示 边 。 这 一 表示 很 容易 沿 着 边 的 走向 遍历 此 图 。 它 不 提供 
对 结 点 的 随机 存 取 ， 为 了 对 此 作出 补偿 ,我们 可 以 加 入 一 个 结 点 指针 数组 ， 并 以 结 点 的 整数 名 字 为 索引 。 
由 于 这 一 小 小 的 增加 《在 图 中 没有 显示 出 来 ) ， 此 图 更 适合 解决 前 向 数据 流 问 题 。 它 为 寻找 一 个 结 点 的 
所 有 后 继 提供 快速 方法 。 l 
遗憾 的 是 ， 编 译 器 通常 需要 沿 着 边 反方 向 遍历 这 个 cfg。 例 如 ， 这 一 情况 出 现在 向 后 数据 流 问 题 中 ， 
此 时 算法 需要 快速 前 驱 操 作 。 为 使 此 图 的 结构 适合 向 后 遍历 ,我 们 需要 增加 另 一 个 指向 每 个 结 点 的 指针 ， 
并 创建 第 二 个 边 结构 集合 来 表示 一 个 结 点 的 前 驱 。 这 一 方法 的 确 可 行 ， 但 是 这 一 数据 结构 变 得 复杂 从 而 
难以 画 出 、 实 现 和 调试 。 . 
与 树 类 似 ， 另 一 个 方法 是 把 此 图 表示 成 一 对 表格 : 一 个 是 结 点 的 表格 ， 另 一 个 是 边 的 表格 。 结 点 表 
格 有 两 个 域 : 一 个 域 是 到 后 继 的 第 一 条 边 ， 另 一 个 域 是 到 前 驱 的 第 一 条 边 。 而 边 的 表格 有 四 个 域 : 第 一 
对 域 保 存 所 表示 边 的 源 和 目标 ， 而 另外 一 对 域 保存 源头 的 下 一 个 后 继 和 目标 的 下 一 个 前 驱 。 使 用 这 一 方 
E, 我 们 的 示例 cfg 的 表格 如 下 所 示 。 
. 结 点 
名 称 后 继 Al 
nm o ' ey 一 
+ n ez eo 
n e; e 
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边 
名 R 源 B $R 下 一 个 后 继 下 一 个 前 驱 
ey No ny e) e3 
el No nz 一 ez 
ez n n — — 
es nz ni 一 一 


这 一 表示 提供 对 后 继 和 前 驱 的 快速 存 取 ， 以 及 通过 各 个 结 点 和 边 的 名 字 对 它们 的 快速 存 取 (假设 这 
些 名 字 是 由 小 整数 表示 的 。) 

表格 表示 对 于 遍历 图 和 寻找 前 驱 和 后 继 都 很 有 效 。 如 果 频 繁 地 在 这 一 图 上 运用 其 他 操作 ， 那 么 可 以 
找到 更 好 的 表示 。 例 如 ， 图 着 色 寄 存 器 分 配器 中 的 支配 操作 在 冲突 图 中 试 测 一 个 边 的 存在 ， 并 在 一 个 结 
点 的 邻居 上 进行 迭代 。 为 了 支持 这 些 操 作 ， 大 多 数 实现 使 用 两 个 不 同 的 图 表示 (参见 13.5.3 节 )。 为 了 回 
答 成 员 问 题 ， 即 边 (i, j) 在 图 中 吗 ? 这 些 实现 使 用 一 个 位 矩阵 。 因 为 冲突 图 是 无 向 的 ， 所 以 下 三 角 位 
矩阵 就 是 够 了 ， 这 大 致 可 以 节省 完整 位 矩阵 所 需 空间 的 一 半 。 为 了 在 一 个 结 点 的 邻居 上 快速 兴 代 ， 要 使 
用 一 组 邻接 向 量 。 

因为 冲突 图 既 大 又 是 稀疏 的 ， 所 以 邻接 向 量 的 空间 可 能 成 为 问题 。 某 些 实现 使 用 两 遍 操 作 来 构建 此 
图 ， 第 一 遍 计算 每 一 个 邻接 向 量 的 尺寸 ， 第 二 遍 构建 向 量 ， 每 一 个 向 量 带 最 小 所 需 尺 寸 。 其 他 实现 使 用 
B.2.1 节 的 集合 列表 表示 的 变形 ， 构 建 此 图 只 使 用 一 遍 操作 ， 对 邻接 向 量 使 用 无 序列 表 ， 且 每 个 列表 结 点 
有 多 个 边 。 


B.3.2 线性 中 间 形 式 


如 ILOC 这 样 的 线性 中 间 形 式 在 概念 上 吸引 人 的 地 方 是 ， 作 为 结构 数组 它们 有 一 个 简明 的 实现 。 例 
如 ，ILOC 程 序 有 一 个 到 FORTRAN 风 格 的 数组 的 直接 映射 ，n 个 ILOC 操 作 映 射 到 (n x 4) 元 整数 数组 。 
操作 码 决 定 如 何 解释 每 一 个 操作 数 。 当 然 ， 任 何 设 计 决 策 都 有 其 优点 和 缺点 ， 而 且 希 望 使 用 线性 IR 的 编 
译 器 设计 者 应 该 考虑 简单 数组 之 外 的 其 他 表示 。 

1. FORTRAN 风 格 数组 

使 用 整数 组 数 来 保存 IR 保 证 对 各 个 操作 码 和 各 操作 数 的 快速 存 取 ， 并 降低 分 配 和 存 取 的 负荷 。 处 理 
IR 的 遍 应 该 快速 运行 ， 因 为 使 用 标准 分 析 和 为 了 改进 密集 线性 代数 程序 而 开发 的 转换 可 以 改进 所 有 数组 
的 存 取 。 经 过 代码 的 一 个 线性 遍 拥有 可 预 测 内 存 位 置 ; 因为 连续 的 操作 占据 连续 内 存 位 置 ， 它 们 在 缓冲 
器 中 不 可 能 产生 冲突 。 如 果 编 译 器 必须 把 IR 写 到 外 部 媒介 中 (例如 ， 在 两 个 遍 之 间 )， 那 么 它 可 以 使 用 
有 效 的 块 1O 操 作 。. 

然而 ， 数 组 实现 也 存在 缺点 。 如 果 编 译 器 需要 把 一 个 操作 插入 代码 中 ， 那 么 它 必 须 为 新 操作 创建 空 
间 。 同 样 地 ， 删 除 也 将 缩小 代码 。 任 意 种 类 的 代码 移动 都 会 遇 上 其 中 的 某 些 问题 。 朴 素 的 实现 可 以 通过 
混 洗 操作 来 创建 这 一 空间 ; 采用 这 一 方法 的 编译 器 通常 在 数组 中 在 分 支 和 跳 转 之 后 留 有 空 模 ， 以 便 减少 
所 需 的 混 洗 数量 。 . 

另外 一 个 策略 是 使 用 detour 操 作 符 把 对 IR 的 任意 遍历 导向 一 个 离线 代码 片段 。 这 一 方法 使 得 编译 器 
在 离线 代码 片段 中 穿插 控制 ， 这 样 可 以 通过 使 用 detour 复 写 一 个 现存 的 操作 来 完成 一 个 插入 ， 这 把 被 插 
入 代码 和 被 复写 操作 放 到 数组 的 末端 ， 然 后 是 一 个 detour ， 它 在 第 一 个 detour 之 后 返回 这 个 操作 。 这 一 
策略 的 最 后 一 个 阶段 是 间断 性 地 线性 化 detour ， 例 如 ， 在 每 一 亡 的 未 尾 ， 或 当 detour 的 数目 超过 某 个 限 
度 时 进行 。 
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伴随 着 数组 实现 的 另 一 个 复杂 性 是 由 这 样 的 间断 性 操作 的 需求 引起 的 ， 例 如 对 取 可 变 操作 数 的 4 函 
数 的 需求 。 在 得 到 ILOC 的 编译 器 中 ， 过 程 调用 由 一 个 复杂 的 操作 表示 。 这 一 调用 操作 对 每 一 个 形 参 有 
一 个 操作 数 ，( 如果 需 要 ) 有 一 个 返回 值 的 操作 数 ， 以 及 调用 可 能 修改 和 使 用 的 两 个 值 列表 操作 数 。 这 
一 操作 不 适合 n x 4 个 元 素数 组 模型 ， 除 非 操作 数 被 解释 成 指向 参数 、 被 修改 变量 和 已 使 用 变量 的 列表 的 
指针 。 


2. 结构 列表 

数组 实现 的 另外 一 个 方法 是 使 用 结构 列表 。 在 这 一 方案 中 ， 每 一 个 操作 有 独立 的 结构 和 指向 下 一 个 
操作 的 指针 。 因 为 可 以 为 每 一 个 操作 分 别 分 配 结构 ， 所 以 程序 表示 很 容易 扩展 到 任意 尺寸 。 因 为 顺序 是 
由 链接 操作 的 指针 引入 的 ， 所 以 可 以 直接 使 用 指针 赋值 插入 和 移 除 操作 ， 而 无 需 混 洗 或 找 贝 。 如 前 所 述 
的 调用 操作 这 样 的 可 变 长 度 操作 可 以 使 用 不 同 的 结构 来 处 理 ; 事实 上 ， 诸 如 1oadI 和 junmp 这 样 的 短 操作 ， 
也 可 以 使 用 不 同 的 结构 处 理 以 节省 空间 。 

当然 ， 使 用 分 别 分 配 的 结构 会 增加 分 配 负担 ， 数 组 需要 一 次 初始 分 配 ， 而 列表 方案 对 每 一 个 IR 操 作 
需要 一 次 分 配 。 列 表 指 针 增 加 所 需 的 空间 。 因 为 所 有 处 理 巩 的 编译 器 遍 必须 包含 很 多 基于 指针 的 引用 ， 
这 些 遍 的 代码 可 能 比 使 用 简单 数组 实现 的 代码 慢 ， 因 为 基于 指针 的 代码 通常 比 数 组 密集 代码 更 加 难以 分 


， 析 和 优化 。 最 后 ， 如 果 编 译 器 在 遍 之 间 把 豚 写 人 外 部 媒介 ， 那 么 在 它 写 巩 以 及 从 外 部 媒介 读 取 并 再 构建 


这 一 列表 时 ， 它 必须 遍历 这 一 列表 。 这 使 1O 慢 下 来 。 

在 某 种 程度 上 ， 可 以 通过 在 实 存 块 或 数组 中 实现 结构 列表 来 改善 这 些 缺 点 。 使 用 基于 实 存 块 的 分 配 
器 ,分配 的 代价 降 到 在 典型 的 情况 下 的 一 个 测试 和 一 个 加 法 。9 实 存 块 也 大 致 产生 与 简单 数组 实现 相同 
的 局 部 化 。 

在 数组 中 实现 列表 可 以 达到 相同 的 目标 ， SABA HEH ER IE TA 经 验 表明 这 可 以 
简化 调试 也 使 得 使 用 块 O 操 作 写 和 读 蕉 成 为 可 能 。 


B.4 实现 散 列表 


散 列表 实现 中 的 两 个 核心 问题 是 保证 散 列 函数 (对 它 使 用 的 所 有 尺寸 的 表 ) 产生 整数 的 均匀 分 布 以 
及 以 高 效 的 方式 处 理 冲 突 。 寻 找 好 的 散 列 函数 很 困难 。 好 在 ， 散 列 已 经 使 用 了 很 长 时 间 ， 文 献 中 已 描述 
了 许多 优秀 的 散 列 函数 。 

本 节 的 其 余部 分 描述 实现 散 列 表 中 所 引发 的 设计 问题 。B.4. 1 地 给 出 实践 中 生产 好 结果 的 两 个 散 列 孙 
数 。 下面 的 两 节 给 出 最 为 广泛 使 用 的 两 个 解决 冲突 的 策略 。B.4.2 节 描述 开放 数列 (open hashing) 策略 
(有 了 时 称 为 桶 式 散 列 (bucket hashing ))， 而 B.4.3 节 给 出 另 一 个 称 为 开放 寻 址 (open addressing) BAK 
列 (rehashing) 的 策略 。B.4.4 节 讨论 散 列 表 的 存储 管理 问题 ， 而 B.4.5 节 给 出 如 何 把 词法 作用 域 结合 到 
这 些 方案 中 。 最 后 一 节 处 理 编 译 器 开发 环境 中 引发 的 特殊 问题 ， 即 对 散 列 表 定义 的 频繁 修改 问题 。 


组 织 符号 表 
在 设计 符号 表 时 ， 编 译 器 设计 者 面临 的 第 一 个 决策 是 符号 表 的 组 织 和 它 的 搜索 算法 。 正 如 在 其 


| 他 很 多 应 用 中 那样 ， 编 译 器 设计 者 有 若干 选择 。 
| 线性 列表 ”线性 表 可 以 扩展 到 任意 大 小 。 其 搜索 算法 是 一 个 简单 、 小 而 紧凑 的 循环 。 遗 憾 的 是 ， 
搜索 算法 对 于 每 一 次 查 表 平 均 需 要 O(n) 次 探查 ， 其 中 "是 表 中 符号 的 数量 。 这 一 缺点 几乎 总 是 超过 | 





O 在 第 一 追 之 后 的 任意 遍 中 ， 编 译 器 应 该 有 关于 IR 大 小 的 相当 精确 的 概念 。 因 此 ， 它 可 以 分 配 既 持 及 又 持 
有 若干 附加 空间 的 实 存 块 ， 并 避免 扩展 实 存 块 的 高 昂 代 价 。 
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实现 和 扩展 的 简单 性 。 为 了 证 实 使 用 线性 列表 的 正当 性 ， 编译 器 设计 者 需要 强 有 力 的 证 据 ， 证 明 被 | 
| 编译 的 过 程 有 非常 少 的 名 字 ， 如 面向 对 象 语言 中 可 能 发 生 的 那样 。 
| 二 分 搜索 “为 了 在 改进 线性 表 的 搜索 时 间 的 同时 保留 其 易 扩展 性 ， 编 译 器 设计 者 可 能 使 用 平衡 | 
二 又 树 。 理 想 地 ,平衡 二 叉 树 允许 对 于 每 一 次 查找 使 用 O(logzn) 次 探查 ; 这 是 对 线性 表 的 一 个 相当 | 
可 观 的 改进 。 已 有 很 多 平衡 搜索 树 的 算法 。( 通 过 使 用 有 序 表 的 二 分 搜索 也 可 以 达到 类 似 的 效率 ，| 
但 是 这 个 表 的 插入 和 扩展 更 加 困难 .) | 
KAR ” 散 列表 可 以 最 小 化 存 取 代价 。 它 的 实现 直接 根据 名 字 计 算 表 索引 。 只 要 计算 产生 好 的 


| 索引 分 布 ， 平 均 存 取代 价 将 变 成 0(1)。 然 而 ， 最 坏 的 情况 可 能 是 线性 搜索 。 编 译 器 设计 者 可 以 采用 | 

一 系列 步 又 来 降低 最 坏 情况 发 生 的 可 能 性 ， 但 是 ， 病 态 情况 仍然 要 出 现 。 很 多 散 列表 实现 对 于 扩展 | 
| 来 说 有 成 本 低 方案 。 | 
: 多 重 集 判 定 ”为 了 避免 最 坏 情 况 行为 ， 编 译 器 设计 者 可 以 使 用 称 为 多 重 集 判定 (multiset | 

discrimination) 的 脱 机 技术 。 这 一 技术 以 在 源 文本 上 的 一 次 额外 的 遍 为 代价 ， 为 每 一 个 标识 符 创建 | 
| 不 同 的 索引 。 这 一 技术 避免 了 总 是 存在 于 散 列 中 的 病态 行为 。( 详细 描述 参见 第 5 章 的 附 标题 散 列 的 | 

替代 。) 
| 在 这 些 组 织 中 ， 最 通常 的 选择 是 散 列表 。 与 线性 表 和 二 又 树 相 比 ， 它 提供 更 好 的 编译 时 行为 ，| 
| 而 且 其 实现 技术 也 得 到 广泛 的 研究 和 传授 。 


B.4.1 选择 散 列 函数 


无 论 如 何 强调 优秀 散 列 函数 的 重要 性 都 不 过 分 。 产 生 不 好 索引 值 分 布 的 散 列 函 数 ， 直 接 增加 把 各 项 
加 插入 表 中 并 在 后 来 寻找 这 些 项 的 平均 代价 。 幸 运 的 是 ， 文献 中 描述 了 很 多 好 的 散 列 函数 ， 包 括 由 
Knuth 给 出 的 乘法 散 列 函 数 和 由 Cormen 等 给 出 的 通用 散 列 函 数 。 
1. 乘法 和 散 列 函数 
#5447] b & (multiplicative hash function) 看 似 简单 。 程序 员 选 择 一 个 常量 C 并 把 它 用 于 下 面 的 
公式 中 : . 
h(key) = |TableSize. ((C - key) mod 1)| 


其 中 C 是 这 个 常量 ，key 是 被 用 作 进入 这 一 表格 的 键 值 的 整数 ,而 TableSize 显 然 是 这 一 散 列表 的 当前 尺寸 。 
Knuth 给 出 了 C 的 值 0.618 033988 7 = (V5 -1)/2。 这 一 函数 的 效应 是 计算 C. key， 使 用 模 函 数 取 其 小 数 部 
分 ， 并 把 结果 与 表 的 尺寸 相 乘 。 

2. 通用 散 列 函数 

HTAA 4B AK (universal hash function)， 程 序 员 设 计 一 个 可 以 以 一 小 组 常量 为 参数 的 函数 
族 。 在 执行 时 随机 地 选取 一 组 常量 值 : 或 者 为 这 些 常 量 值 选取 随机 数字 ， 或 者 通过 随机 选取 下 标 在 已 经 
测试 过 的 常量 的 集合 中 进行 选取 。( 在 使 用 散 列 函数 的 程序 的 每 一 次 执行 过 程 中 使 用 相同 的 常量 ， 但 是 ， 


这 组 常量 会 随 执行 而 变化 。 ) 通过 改变 每 一 次 执行 的 散 列 函 数 ， 通用 散 列 函数 在 程序 的 每 一 次 运行 中 产 
. 生 不 同 的 分 布 。 对 于 编译 器 ， 如 果 输入 程序 在 某 个 特定 编译 中 产生 病态 行为 ， 那 么 很 有 可 能 在 后 继 的 编 


译 中 不 产生 相同 的 病态 行为 。 为 了 实现 乘法 散 列 函 数 的 通用 版 本 ， 编 译 器 设计 者 可 以 在 编译 开始 时 随机 
生成 C 的 一 个 适当 值 。 





oo 
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| 拙劣 的 散 列 函数 的 危险 


| 散 列 函 数 的 选择 对 表 的 插入 和 查找 代价 产生 关键 的 影响 。 这 是 一 个 少量 的 注意 可 能 产生 较 大 差 | 
| 异 的 例子 。 | 
| 很 多 年 前 ， 我 们 看 到 一 名 学 生 为 字符 串 实 现下 面 的 散 列 函 数 : (1) 把 键 值 分 成 4 字 节 块 ，(2) | 
把 它们 异 或 到 一 起 ，(3) 取 其 结果 数字 e 模 表 的 尺寸 作为 索引 。 这 一 函数 相当 快 。 它 有 一 个 直接 而 
| 高效 的 实现 。 对 于 某 些 表 尺寸 ， 它 产生 适当 的 分 布 。 

当 这 一 学 生 把 这 一 实现 插入 到 一 个 在 FORTRAN 程 序 上 执行 源 语言 到 源 语言 的 转换 时 ， 若 干 独 | 


| 立 的 事实 相 结合 带 来 了 算法 上 的 灾难 。 第 一 ， 这 一 实现 的 语言 把 字符 串 的 右 侧 附 上 空格 以 达到 4 字 | 
节 边 界 。 第 二 ， 这 个 学 生 选择 表 的 初始 尺寸 为 2048。 最 后 ，FORTRAN 程 序 员 使 用 很 多 一 个 字符 或 | 

两 个 字符 的 变量 名 ， 如 1、j、k、x、y 和 z。 

| 所 有 短 变量 名 都 适合 单一 字 ， 避 免 了 异 或 的 任意 效应 。 然 而 ， 取 e 模 2048 删 去 了 除 e 的 最 后 11 个 

| 位 之 外 的 所 有 位 。 因 此 ， 所 有 短 变量 名 产生 相同 的 索引 ， 一 对 空格 的 最 后 11 位 。 这 一 散 列 搜索 立即 | 

| 变 成 了 线性 搜索 。 在 这 一 特殊 散 列 函数 与 理想 相差 其 远 的 同时 ， 把 表 的 尺寸 改 成 2047 可 以 消除 这 最 

| 引 人 注 目的 负 效 应 。 | 





B.4.2 开放 散 列 


开放 最 列 〈open hashing), HERH AKI] (bucket hashing), ， 假 设 散 列 函 数 h 产 生 冲 突 。 它 依赖 于 
/来 把 输入 键 值 集合 划分 成 一 个 固定 数量 的 集合 ， 即 桶 (bucket)。 每 一 个 桶 包含 一 个 记录 的 线性 列表 ， 
每 一 个 名 字 一 个 记录 。LookUp(n) 遍历 存储 标签 h(n) 为 下 标的 桶 内 的 线性 列表 来 寻找 nx。 因此 ，LooUp 需 
要 h(n) 的 一 个 评估 和 一 个 线性 列表 的 遍历 。 评 估 h(n) 应 该 很 快 完成 ; 而 列表 的 遍历 所 花 的 时 间 与 列表 长 
度 成 正比 。 对 于 尺寸 为 S 且 有 N 个 名 字 的 散 列表 ， 每 一 次 查找 的 代价 大 致 为 O(N/S)。 只 要 4 相当 一 致 地 分 
布 名 字 且 名 字 与 桶 的 比率 很 小 ， 那 么 查找 代价 近似 干 我 们 的 目标 :对 于 每 一 次 存 取 ， 查 找 的 次 数 为 
O(1). 

O 图 B-4 给 出 使 用 这 一 方案 实现 的 一 个 小 型 散 列表 。 它 假设 h(a) =h(d) = 3 带 来 一 个 冲突 。 因 此 ，a 和 d 
占据 表 中 相同 槽 。 这 一 列表 结构 把 a 和 4 链接 起 来 。 为 了 提高 效率 ，Tnsert 应 该 把 数据 添加 在 桶 的 前 端 。 





图 B-4 开放 散 列 表 


开放 散 列 有 几 个 优点 。 因 为 它 为 每 一 个 播 入 的 名 字 在 链接 列表 之 一 创建 一 个 新 的 结 点 ， 所 以 它 可 以 





KK HE 4 H 399 


在 不 用 尽 空间 的 情况 下 ， 处 理 任意 数量 的 名 字 。 在 一 个 桶 内 有 大 量 的 条 目 不 影 响 其 他 桶 内 的 存 取代 价 。 


因为 桶 集合 的 具体 表示 通常 是 一 个 指针 数组 ， 所 以 增加 5 的 负担 很 小 ， 对 每 一 个 桶 需要 一 个 指针 。( 这 使 
得 维持 S/N 在 较 小 的 范围 内 的 代价 较 小 。 每 一 个 名 字 的 代价 是 一 个 常量 。) 选择 5 为 二 的 吞 可 以 减 小 实现 h 
所 需 的 取 模 操作 的 代价 。 . 

开放 散 列 的 主要 缺点 直接 与 这 些 优点 相关 。 概 括 起 来 有 两 点 。 

1) 开放 散 列 可 能 频繁 地 分 配 。 每 一 个 插入 分 配 一 个 新 记录 。 在 内 存 分 配 很 费时 的 系统 上 实现 时 ， 
这 可 能 很 可 观 。 使 用 不 费时 的 分 配 机 制 ， 如 基于 实 存 块 分 配 (参见 第 6 章 的 附 标题 ) 可 以 缓解 这 一 问题 。 

2) 如 果 任 意 特定 集合 变 大 ， 那 么 Lookup 则 退化 成 线性 搜索 。 使 用 合理 行为 的 散 列 函数 ， 当 N 比 $ 大 
得 多 时 ， 上 述 情况 才 有 可 能 出 现 。 实 现 应 该 发 现 这 一 问题 ， 并 扩大 桶 数组 。 典 型 地 ， 这 涉及 分 配 一 个 新 
的 桶 数组 ， 并 把 原 表 中 每 一 条 目 重 新 插入 新 表 中 。 

实现 良好 的 开放 散 列表 在 空间 和 时 间 上 以 低 负荷 提供 有 效 的 存 取 。 

为 了 改进 在 单一 桶 内 执行 线性 搜索 的 行为 ， 编 译 器 可 以 动态 地 记录 桶 链 。Rivest 和 其 他 人 [291， 
309] 给 出 两 个 有 效 的 策略 : 在 每 一 次 查找 中 把 查找 到 的 结 点 提升 一 个 位 置 ， 或 在 每 一 次 查找 中 把 它 移 到 
列表 的 前 面 。 也 可 以 使 用 更 复杂 的 方案 组 织 每 一 个 桶 。 然 而 ， 编 译 器 设计 者 在 对 这 一 问题 投放 更 多 努力 
之 前 ， 他 们 应 该 评 佑 遍历 一 个 桶 所 损失 的 时 间 总 量 。 


B.4.3 FRB 


开放 寻 址 (open addressing), ERARI] (rehashing )， 当 在 正常 情况 下 h(n) 所 在 的 寞 已 被 占据 时 ， 
为 h(n) 计算 一 个 替换 索引 ， 以 此 来 处 理 冲 突 。 在 这 一 方案 中 ，LookUp(m 计算 h(n) 并 检查 那个 槽 。 如 果 
这 个 槽 是 空 的 ， 那 么 LookUp 失 败 。 如 果 Lookup 找 到 ”， 它 成 功 。 当 它 找 到 一 个 名 字 但 不 是 nr 暑 ， 它 使 用 第 
二 个 函数 g(n) 计算 这 次 搜索 的 增 量 。 这 导致 它 检查 (Km+8(0D) 模 8 处 的 表格 ， 然 后 是 (h(n) 十 2 x g(n)) 
模 $ 处 的 表格 ， 再 然后 是 (h(n) +3.x g(n)) 模 5 处 的 表格 ， 依 此 类 推 ， 直到 它 或 者 找到 n， 或 者 发 现 一 个 
空 权 ， 或 者 再 次 返回 到 h(n) (这 一 表 被 从 0 标号 到 5 - 1， 这 保证 模 $ 将 返回 一 个 有 效 的 表 索 引 。) 如 果 
LookUp 找 到 一 个 空 攀 ， 或 再 次 返回 h(n) ， 那 么 查找 失败 。 

图 B-5 给 出 用 这 一 方案 实现 的 小 型 散 列表 。 它 使 用 与 图 B-4 相 同 的 数据 。 如 从 前 一 样 ，h(a)=h(d)=3， 
而 Ab) = 1 且 /Mc)=9。 当 d 被 插入 时 ， 它 与 a 产 生 一 个 冲突 。 第 二 个 散 列 国 数 g8(d) 产生 2， 所 以 Insert 把 d 
放 在 表格 中 下 标 为 5 的 地 方 。 事 实 上 ， 开 放 寻 址 构建 类 似 于 那些 用 于 开放 散 列 中 的 条 目 链 。 然 而 ， 在 开 
放 式 寻 址 中 ， 这 一 链 被 直接 存储 于 表格 之 中 ， 而 且 单 一 表格 位 置 可 以 充当 多 个 链 的 开始 点 ， 每 一 个 带 有 
由 8 产生 的 不 同 增 量 。 
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图 B-5 开放 地 址 表 
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这 一 方案 进行 了 时 间 和 空间 之 间 的 微妙 权衡 。 因 为 每 一 个 键 都 被 存储 于 表 中 ，5 必 须 比 N 大 。 如 果 由 
于 hp 和 8 产生 良好 分 布 而 冲突 不 频繁 ， 那 么 再 散 列 链 保持 较 短 而 且 处 理 代价 保 持 较 低 。 因 为 它 可 以 廉价 地 
再 计算 8， 所 以 这 一 方案 无 需 存储 指针 形成 再 散 列 链 ， 可 以 节省 N 个 指针 。 这 一 空间 上 的 节省 允许 更 大 的 
散 列表 ， 而 更 大 的 表 可 以 通过 降低 产生 冲突 的 频率 而 改进 执行 。 开 放 寻 址 的 主要 优点 很 简单 : 通过 较 短 
的 再 散 列 链 降低 存 取代 价 。 

开放 寻 址 有 两 个 主要 的 缺点 。 当 NN 靠近 5 而 表 变 满 时 ， 就 会 引发 这 两 个 缺点 。 

1) 因为 再 散 列 链 穿 过 索引 表格 ，n 和 mm 之 间 的 冲突 可 能 会 干扰 某 个 其 他 名 字 p 的 后 继 插入 。 如 果 h(n) 
=h(m) H. (h(m)+ g(m) mod 5=h(p)， 那 么 插入 n 后 再 插入 m 填 充 表 中 p 的 模 。 当 这 一 方案 行为 良好 时 ， 
这 一 问题 的 影响 较 小 。 当 N 靠 近 5 时 ， 它 会 变 得 显著 。 

2) 因为 5 至 少 和 VN 一 样 大 ， 所 以 如 果 NN 太 大 时 ， 必 须 扩 展 这 个 表 。( 同样 地 ， 当 某 个 链 变 得 太 大 时 ， 
实现 也 要 扩展 5。) 扩展 是 正确 性 的 需要 ; 对 于 开放 散 列 ， 这 是 有 效 性 的 关键 。 

某 些 实现 对 8 使 用 常量 函数 。 这 简化 实现 并 减 小 计算 第 二 索引 的 代价 。 然 而 ， 它 为 p 的 每 一 个 值 创建 
单一 再 散 列 链 ， 并 在 第 二 索引 过 到 一 个 已 被 占据 的 表格 槽 的 地 方 产生 合并 再 散 列 链 的 效应 。 这 两 个 缺点 
超过 了 评估 第 二 散 列 函数 的 代价 。 更 合理 的 选择 是 使 用 两 个 带 有 不 同 常量 的 乘法 散 列 函数 : 如 果 可 能 ， 
在 开始 时 从 常量 表 做 随机 选取 。 

表格 的 尺寸 在 开放 寻 址 中 起 着 重要 的 作用 。Lookup 必 须 识 别 它 是 否 达到 了 已 访问 表 槽 ; 否则 ， 它 
0 
<5 的 任意 选择 生成 一 系列 探查 ，pi、 …、Ps 且 有 性 质 p, =ps=h(n) 且 对 于 任意 满足 1 <i<5 的 i,， p+ 
h(n)。 因 为 实现 可 能 需要 扩展 表格 ， FLERE TERROR. . 由 于 对 程序 大 小 和 编译 器 可 用 
内 存 的 实际 限制 ， 一 小 组 素数 就 是 够 了 。 


B.4.4 存储 符号 记录 


开放 散 列 和 开放 寻 址 都 不 直接 处 理 如何 给 与 每 一 个 散 列 表 条 目 相 关 的 信息 分 配 空 间 。 对 于 开放 散 列 ， 
其 诱惑 是 直接 分 配 实现 链 的 结 点 中 的 记录 。 对 于 开放 寻 址 ， 其 诱惑 是 避免 指针 并 使 索引 表 中 的 每 一 个 条 
目 是 符号 记录 。 这 两 个 方法 都 有 缺点 。 我 们 可 以 通过 使 用 一 个 独立 的 已 分 配 栈 来 保存 这 些 记录 而 到 达 更 
好 的 结果 。 

图 B-6 描 述 这 一 一 实现 。 在 开放 获 列 实现 中 ， 链表 本 身 可 以 在 本 上 实现 。 这 降低 分 配 各 个 记录 的 代价 ， 
当 分 配 是 一 个 耗 时 操作 时 尤为 如 此 。 在 开放 寻 址 实现 中 ， 再 散 列 链 仍 隐 含 于 索引 集合 中 ， 这 保持 作为 这 
一 方案 的 动机 的 空间 节省 。 





图 B-6 保存 记录 的 栈 分 配 
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当 实际 记录 存储 于 栈 中 时 ， 它 们 形成 一 个 稠密 表 ， 它 对 外 部 MO 更 适合 。 对 于 耗 时 的 分 配 ， 这 一 方 
案 把 这 一 较 大 的 分 配 代价 平 摊 到 很 多 记录 上 。 对 于 垃圾 回收 器 ， 它 减少 必须 被 标记 和 回收 的 对 象 数量 。 
无 论 在 哪 种 情况 下 ， 拥 有 稠密 表 都 可 以 使 表 中 符号 上 的 选 代 更 有 效 : 这 是 编译 器 用 于 执行 诸如 赋 存 储 位 
置 等 任务 的 操作 。 

作为 最 后 一 个 优点 ， 这 一 方案 大 大 简化 扩展 索引 集合 的 任务 。 为 了 扩展 索引 集合 ， 编 译 器 放弃 旧 的 ”169 
索引 集合 ,分配 一 个 更 大 的 集合 ， 然 后 从 栈 底 到 栈 顶 重新 把 记录 插入 新 表 中 。 这 消除 暂时 在 内 存 同时 拥 
有 新 旧 表格 的 需要 。 与 跟踪 指针 来 遍历 开放 散 列 中 的 列表 相 比 ， 在 稠密 表 上 进行 选 代 的 工作 量 一 般 更 少 。 
它 避 免 在 空 表 术 中 的 选 代 ， 而 这 可 能 在 开放 寻 址 扩展 索引 集合 以 使 链 变 短 时 发 生 。 

编译 器 无 需 把 整个 栈 作为 单一 对 象 来 分 配 。 相 反 ， 对 于 某 个 适当 的 &:， 这 个 栈 可 以 作为 含有 k 个 记录 
的 结 点 的 链 来 实现 。 当 一 个 结 点 变 满 时 ， 这 一 实现 分 配 一 个 新 结 点 ， 把 它 加 到 链 的 末端 ， 并 继续 下 去 。 
这 为 编译 器 设计 者 提供 掌管 分 配 代 价 和 浪费 空间 之 间 的 折 中 的 细微 控制 。 


B.4.5 WWE REA 


5.7. 375K T ORERE ERRA SRP ROAR. ECHMRUBRAS RRO MRR, 
. 每 一 层 创建 一 个 。 虽 然 实 现在 概念 上 是 清楚 的 ， 但 是 它 把 作用 域 的 负荷 推 给 LookUp， 而 不 是 Initia- 
1izeScope、Fina?1zeScope 和 Insert。 因 为 编译 器 调用 LookUp 的 次 数 比 它 调用 其 他 程序 的 次 数 多 很 多 ， 
所 以 其 他 实现 也 值得 考虑 。 

再 次 考虑 图 5-10 中 的 代码 。 它 生成 如 下 动作 。 

个 (w,0) (x,0) (example,0). + (a,1) (b,1) (c,1) 

T (bs2) (242) 4 T (as2) (xs2) + (es3), 3) LES 


其 中 ,1 表示 对 In1tializeaScope 的 一 个 调用 ,| 表示 对 FinalizeScope 的 一 个 调用 ， 而 序 对 <name， 
心 表示 对 Insert 的 一 个 调用 来 把 name 加 到 层次 x 上 。 l 

1. 把 词法 作用 域 加 入 到 开放 散 列 

考虑 当 我 们 把 词汇 等 级 域 加 到 每 一 个 名 字 的 记录 中 ， 并 在 链 的 前 面 插入 新 名 字 时 ， 在 开放 散 列 表 中 将 
发 生 什么 。Tnsert 可 以 通过 比较 名 字 和 词法 等 级 来 检查 重复 。 对 于 给 定名 字 ，LookUp 返 回 它 发 现 的 第 一 个 
记录 。Init1a]izeScope 将 增加 当前 词法 等 级 的 计数 器 。 这 一 方案 把 复杂 性 推 向 FinalizeScope， 
Final1zeScope 不 仅 必须 降低 当前 词法 竺 级， 而且 还 必须 移 除 释放 了 的 作用 域 中 插入 的 所 有 名 字 的 记录 。 

如 果 如 图 B-4 所 示 开 放 散 列 是 通过 分 配 链 中 每 一 个 结 点 来 实现 的 ， 那 么 FinalizeScope 必 须 找 到 要 丢 
弃 作 用 域 中 的 所 有 记录 ， 并 把 它们 从 相应 的 链 中 消除 。 如 果 它 们 后 来 不 再 在 编译 器 中 使 用 ， 那 么 
FinalizeScope 必 须 释放 它们 ; 否则 ， 它 必须 把 它们 连 到 一 起 保存 起 来 。 图 B-7 给 出 这 一 方法 在 图 5-10 的 
赋值 语句 处 产生 的 表 。 

使 用 栈 分 配 记录 ，FinalizeScope 可 以 从 栈 顶 向 下 过 代 ， 直 到 它 达到 被 丢弃 等 级 下 面 的 某 个 等 级 的 
记录 为 止 。 对 于 每 一 个 记录 ， 它 使 用 链 中 指向 下 一 个 条 目的 记录 指针 来 更 新 索引 集合 人 口 。 如 果 这 一 记 
录 将 被 放弃 ， 那 么 Fna171zesScope 把 指针 重新 设置 为 指向 下 一 个 可 用 槽 ; 否则 ， 这 些 记录 被 保留 在 栈 上 。 
图 B-8 给 出 我 们 例子 在 赋值 语句 处 的 符号 表 。 | 

无 须 太 多 考虑 就 可 以 把 链 的 动态 重 排序 加 入 这 一 方案 中 。 因 为 Fina1izeScope 使 用 栈 顺 序 ， 而 不 是 
链 顺 序 ， 它 仍然 在 栈 的 顶部 找到 所 有 顶级 名 字 。 为 了 对 链 进行 重 排序 ， 编 译 器 或 者 需要 遍历 这 个 链 来 移 
除 每 一 个 删除 名 字 的 记录 ， 或 者 使 用 双 链 表 来 实现 链 以 进行 更 快 的 删除 。 695| 
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图 B-8 栈 分 配 开放 散 列表 中 的 词法 作用 域 


2. 把 词法 作用 域 加 到 开放 导 址 中 | 

对 于 开放 寻 址 表 来 说 ,情况 可 能 会 更 复杂 一 些 。 表 中 的 权 是 关键 的 资源 ， 当 所 有 的 槽 都 被 填 满 时 ， 在 
进一步 的 插入 出 现 之 前 ， 必 须 扩 展 表格 。 在 使 用 再 散 列 的 表 中 进行 删除 很 困难 ; 表 的 实现 无 法 简单 地 告知 
再 散 列 链 的 中 间 是 否 有 已 删除 的 记录 。 因 此 ， 把 槽 标记 为 空 把 通过 该 位 置 的 所 有 链 分 割 开 来 (而 非 在 结尾 
处 )。 这 证 明 在 表 中 为 每 一 个 名 字 的 每 个 变形 存储 离散 的 记录 是 不 适 家 的。 相反， 编译 器 应 该 为 每 一 个 名 
字 只 把 一 个 记录 链接 到 表 中 ; 它 可 以 为 陈旧 变形 创建 替代 记录 链 。 图 B-9 描 述 我 们 例子 的 这 一 情况 。 

这 一 方案 把 大 部 分 复杂 性 推 给 了 Insert 和 FinalizeScope。Insert 在 栈 的 顶部 创建 新 记录 。 如 果 它 
在 索引 表 中 发 现 了 相同 名 字 的 陈旧 声明 ， 那 么 它 用 对 新 记录 的 引用 替换 这 个 引用 ， 并 把 陈旧 的 引用 链接 
到 新 记录 上 。F1nalizeScope 在 栈 上 各 顶端 项 间 迭 代 ， 同 开放 散 列 一 样 。 为 了 移 除 陈旧 变形 的 记录 ， 
FinalizeScope 简 单 地 把 索引 表 重 新 链接 到 陈旧 记录 上 。 为 了 移 除 记录 的 最 后 变形 ， 它 必须 插入 一 个 特 
殊 的 记录 ， 它 表示 一 个 已 删除 的 引用 。Lookup 必 须 通 过 在 当前 链 占据 一 个 槽 来 识别 已 删除 引用 。7msert 
必须 知道 它 能 够 使 用 任意 新 插入 的 符号 来 取代 已 删除 引用 。 | 


h(example) 
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图 B-9 开放 寻 址 表 中 的 词法 作用 域 


本 质 上 这 一 方案 为 冲突 和 再 声明 创建 一 个 独立 的 链 。 冲 突 在 索引 集合 被 串 起 来 。 再 声明 在 栈 中 被 串 
起 来 。 这 将 稍稍 减 小 上 Looktp 的 代价 ， 因 为 它 避 开 为 单一 名 字 检 查 多 个 记录 。 

考虑 开放 散 列 中 包含 7 个 x 的 声明 以 及 层次 0 处 y 的 单一 声明 的 桶 。LookUp 在 找到 y 之 前 可 能 会 遇 到 x 的 
所 有 7 个 记录 。 使 用 开放 寻 址 方案 ，LookUp 遇 到 一 个 x 的 记录 和 一 个 y 的 记录 。 


B5 一 个 灵活 的 符号 表 设 计 


， 大 多 数 编译 器 使 用 符号 表 作 为 关于 在 源 代 码 、 在 IR 及 在 生成 代码 中 出 现 的 各 种 名 字 信 息 的 中 心 储存 
仓 。 在 编译 器 开发 过 程 中 ， 符 号 表 中 的 域 集合 似乎 在 单调 增 大 。 域 被 加 入 表 中 以 支持 新 遍 ， 并 使 各 遍历 
之 间 的 信息 通信 。 当 对 一 个 域 的 需求 消失 时 ， 这 个 域 可 能 从 符号 表 定义 中 移 除 ， 也 可 能 不 移 除 。 随 着 每 
一 个 域 的 加 入 ， 符 号 表 的 尺寸 增 大 ， 且 直接 存 取 这 一 符号 表 的 编译 器 的 任意 部 分 必须 被 重新 编译 。 

我 们 在 尺 的 实现 和 ParaScope 程 序 设计 环境 中 遇 到 了 这 一 问题 。 这 些 系统 的 实验 性 质 导 致 符号 表 域 的 
增添 和 移 除 很 普遍 这 样 一 种 情况 。 为 了 处 理 这 一 问题 ， 我 们 实现 了 一 个 更 复杂 但 更 灵活 的 符号 表 结 构 : 
一 个 二 维 散 列表 (two-dimensional hash table )。 这 消除 几乎 所 有 对 符号 表 定 义 和 实 现 的 变更 。 

如 图 B-10 所 示 的 二 维 表 使 用 两 个 不 同 的 散 列 索引 表 。 图 左 侧 所 示 的 第 一 个 散 列 索引 表 对 应 于 图 B-6 
的 稀疏 索引 表 。 实 现 把 这 个 表 用 于 符号 名 上 的 散 列 。 图 上 部 所 示 的 第 二 个 散 列 索引 表 是 域名 散 列 表 。 程 
序 员 通过 各 个 域 的 文本 名 字 和 符号 名 字 引 用 各 个 域 ; 实现 散 列 符号 名 来 得 到 选择 数据 向 量 的 索引 和 域 
名 。 理 想 的 属性 被 存储 在 符号 索引 下 面 的 向 量 中 。 它 的 行为 就 如 每 一 个 域 有 如 图 B-6 那 样 实现 的 其 自身 
的 散 列表 一 样 。 i 

这 看 来 似乎 很 复杂 ， 但 它 的 成 本 并 不 特别 高 。 每 一 个 表 存 取 需 要 两 个 散 列 计算 ， 而 不 是 一 个 。 实 现 
无 需 为 给 定 域 分 配 存储 空间 ， 直 到 有 值 被 存储 于 其 中 ; 这 避免 未 使 用 域 的 空间 负荷 。 它 人 允许 开发 者 在 不 
与 其 他 程序 员 发 生 冲 突 的 情况 下 创建 和 删除 符号 表 域 。 





我 们 的 实现 为 一 个 域 (通过 名 字 ) 设置 初始 值 、 为 {通过 名 字 ) 删除 一 个 域 以 及 为 报告 域 使 用 统计 | 


等 提供 入 口 点 。 这 一 方案 允许 各 程序 员 以 合理 而 彼此 独立 的 方式 管理 他 们 自己 的 符号 表 使 用 ， 而 不 受 其 
他 程序 员 和 代码 的 干扰 。 

作为 最 后 一 个 问题 ， 实 现 相 对 于 特定 符号 表 来 说 应 该 是 抽象 的 。 也 就 是 说 ， 它 应 该 总 是 把 表 的 实例 
作为 参数 。 这 允许 编译 器 在 很 多 情况 复 用 这 一 实现 ， 例 如 第 8 章 中 的 超 局 部 或 基于 支配 者 的 值 编 号 算法 。 
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h(name) (type) h(offset) h(length) 


h(foe) 


h(fee) 


h(fum) 


h(fie) 





[699] 图 B-10 二 维 散 列 符号 表 
附录 注释 
编译 器 中 的 大 多 数 算法 都 处 理 集合 、 映 射 、 表 格 和 图 。 它 们 的 实现 直接 影响 那些 算法 的 时 空 效率 ， 
最 终 影响 编译 器 本 身 的 可 用 人 性 [54]。 算 法 和 数据 结构 的 教科 书 覆 盖 本 附录 总 结 的 很 多 问题 [220，4，185， 
103, 39]. 
我 们 的 研究 用 编译 器 使 用 了 这 一 附录 中 所 描述 的 几乎 所 有 数据 结构 。 我 们 已 从 若干 领域 中 数据 结构 
的 增长 情况 看 到 了 若干 性 能 问题 。 
。 如 第 5 章 附 标题 提 到 的 抽象 语法 树 可 以 大 到 不 合理 的 程度 。 把 任意 树 映射 到 二 叉 树 的 技术 简化 实现 
且 似乎 可 以 把 额外 负荷 维持 在 很 低 的 水 平 [220]。 
“使 用 后 继 和 前 驱 列 表 的 图 的 表格 表示 已 经 被 反复 重新 发 现 。 它 对 CFG 特 别 适合 ， 对 CFG 编 译 器 要 
在 后 继 和 前 驱 上 进行 选 代 。 我 们 于 1980 年 首次 把 这 一 数据 结构 运用 于 PFC 系统 。 
。 数据 流 分 析 中 的 集合 可 以 成 长 到 占据 几 百 兆 字 节 。 因 为 这 样 规模 的 分 配 和 释放 是 性 能 的 要 因 ， 所 
以 我 们 通常 使 用 Hanson 的 基于 实 存 块 的 分 配器 [171]。 
[700] 。 冲突 图 的 尺寸 和 稀疏 性 使 其 成 为 值得 精心 考虑 的 另 一 个 领域 。 我 们 为 每 一 个 结 点 使 用 多 重 集合 元 
素 的 有 序列 表 变形 来 管理 空间 额外 负荷 的 同时 ， 保 持 构建 这 样 的 图 的 代价 较 低 [94]。 
符号 表 在 编译 器 保存 和 存 取信 息 的 方式 中 起 着 核心 的 作用 。 人 们 在 这 些 表 的 组 织 上 花费 了 大 量 的 精 
力 。 再 组 建 列表 [291，309]、 平 衡 搜索 树 [103 ，39] 和 散 列 [220，vol.3] 都 对 使 这 些 表 高 效 中 起 着 重要 的 
[701] fF. Knuth(220, ，volL.31 和 Cormen[103] 详 细 描 述 了 乘法 散 列 函数 。 
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第 1 章 

1. 考虑 一 个 简单 的 Web 浏 览 器 ， 它 取 输入 HTML 格 式 的 文本 串 并 在 屏幕 上 显示 指定 的 图 像 。 显 示 过 程 是 
编译 或 解释 之 一 吗 ? 

2. 在 设计 编译 器 时 ， 你 将 面 对 很 多 权衡 。 作 为 一 名 用 户 ， 你 考虑 你 购买 的 编译 器 中 最 重要 的 五 个 质量 因 
RETA? 而 当 你 是 编译 器 设计 者 时 ， 这 一 列表 会 变 吗 ? 就 你 将 要 实现 的 编译 器 ， 这 一 列表 会 告诉 你 
什么 ? 

3. 编译 器 被 用 于 很 多 不 同 的 环境 。 对 于 根据 下 面 应 用 所 设计 的 编译 器 ， 你 期 望 的 差异 是 什么 ? 

a. 用 于 翻译 在 网 络 上 下 载 的 用 户 界面 代码 的 即时 (just-in-time) 编译 器 。 

b. 用 于 移动 电话 的 嵌入 式 处 理 器 的 编译 器 。 

c. 用 于 高 中 程序 设计 导论 性 课程 的 编译 器 。 

d. 用 于 构建 运行 于 (所 有 处 理 器 都 是 相同 的 ) 巨型 并 行 处 理 器 的 风 洞 模拟 的 编译 器 。 
e. 目标 是 运行 于 大 量 不 同 机 器 上 的 进行 大 量 数值 计算 的 程序 的 编译 器 。 


第 2 章 
2.2 节 
1. 非 形式 地 找 述 下 面 FA 接 受 的 语言 : 


b) 





2. 构造 接受 下 面 各 语言 的 FA: 
a.{fwEfa，bj}*#|w 以 se 开 始 且 包 含 子 串 papa} 
b. {wE{0, 1} *|waaF HILL AA aa H00} 
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c. {wE{a，b，c}*|w 中 a 的 数目 模 2 与 5 的 数目 模 3 相 等 } | 
3. 创建 识别 (a) 表示 复数 的 字 ， 以 及 (b) 表示 以 科学 记 数 法 格式 表示 的 十 进 制 数 的 字 的 FA。 726 


2.3 节 


1. 不 同 的 程序 设计 语言 使 用 不 同 的 方法 表示 整数 。 构 建 下 面 每 一 种 整数 的 正则 表达 式 : 

a. C 语 言 中 表示 成 以 10 和 16 为 底 的 非 负 整数 。 

b.VHDL 中 可 以 包含 下 划 线 的 非 负 整数 。( 下划线 不 能 出 现在 第 一 个 字符 或 最 后 一 个 字符 。) 

c. 在 美元 中 ， 货 币 被 表示 四 舍 五 入 到 最 近 的 百 分 之 一 的 正 十 进 制 数 。 这 样 的 数 开始 于 字符 $， 从 小 数 
点 左边 使 用 这 号 把 数字 分 成 三 位 一 组 ， 并 以 小 数 点 右边 两 位 数字 结束 ， 例如 ，$8,937.43 和 
$7,777,777.77。 

2. 写 出 下 列 各 语言 的 正则 表达 式 。 

(提示 : 并 非 所 有 描述 刻画 正则 语言 

a. HEF BRI ={0, 1}, 工 是 交 赫 0、1 对 串 组 成 的 集合 。 

b. 给 定 字 母 表 > = {0，1}， 工 是 包含 偶数 个 0 或 偶数 个 1 的 0、1 串 组 成 的 集合 。 

c. 给 定 小 写 英语 字母 表 ， 世 是 所 有 字母 按 字典 顺序 升序 出 现 的 串 组 成 的 集合 。 

d. 给 定 字母 表 5 = {a，b，c，), 工 是 串 ryzwy 的 集合 ， 其 中 x 和 w 是 > 中 一 个 或 多 个 字符 组 成 的 串 ，y 是 
中 的 任意 单一 字符 ， 而 z 是 就 是 字符 z， 它 是 从 字母 表 外 部 取 来 的 。 

(每 一 个 申 xyzwy 都 包含 由 字母 表 中 的 字母 构成 的 两 个 字 xy 和 wy。 这 些 字 的 结束 字母 都 是 y。 它 们 
被 字母 z 分 开 。) : 

©. BEFRRIA{+, -, x, +, (,), id}, LÆÆId EROS. RS. RS. REMA H 
成 的 代数 表达 式 的 集合 。 

3. 写 出 描述 下 列 程序 设计 语言 结构 的 正则 表达 式 : 

a. 横向 跳 格 和 空格 的 任意 序列 (有 时 称 为 空白 符 (white space) ) 。 

b. C 程 序 设计 语言 中 的 注释 。 727 

c. BHE (不 含 转 义 字符 )。 

d. FRR. 
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1. 考虑 下 面 三 个 正则 表达 式 : 
(ab | ac)* 
~ (0} 1)*1 100 1° 
(01 | 10 | 00)* 11 


a. 使 用 Thompson 构 造 法 构造 上 面 每 一 个 正则 表达 式 对 应 的 NFA。 
b. 把 这 些 NFA 转 换 成 DFA。 
c. 最 小 化 上 面 得 到 的 PFA 。 
2. 证 明 两 个 RE 等 价 的 一 个 方法 是 构造 它们 对 应 的 最 小 化 DEFA ， 然 后 比较 它们 。 如 果 它们 只 是 在 状态 名 
字 上 不 同 ， 那 么 这 两 个 RE 等 价 。 使 用 这 一 技术 检查 下 列 的 RE 对 ， 并 说 明 它 们 是 否 等 价 。 
a. (0 | 1)* 和 (0* | 10*)* 
b. (ba)* (ar b* | a*) 和 (ba)* bat (b* | © 
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3. 考虑 下 面 的 正则 表达 式 
rO | roo | rl | rOl] r2} r02 | .… | r09 | r10 | r11 | .| r30 | r31 


运用 结构 法 构建 : 

a. 对 应 于 此 RE 的 NFA。 

b. 对 应 于 上 面 NFA 的 DFA。 

c. 对 应 于 上 面 DFA 的 RE。 

解释 由 源 RE 与 (a) 和 (c) 部 分 所 产生 的 RE 之 间 的 差异 。 
比较 你 生成 的 DEFA 和 第 2 章 由 下 面 RE 构建 的 DFA。 


r(olll12 (009191415161718191G01119) 


4. 最 小 化 前 一 个 练习 所 得 的 DFA 。 最 小 化 后 ， 使 用 更 简单 的 寄存 器 描述 在 尺寸 和 速度 方面 的 损失 是 
什么 ? 
5. 对 于 某 些 情 况 ， 可 以 把 由 e 转 换 连 结 的 两 个 状态 组 合 起 来 。 
a. 在 什么 样 的 条 件 下 ， 可 以 把 两 个 由 s 转 换 连 接 的 状态 组 合 起 来 ? 
b. 给 出 消除 转换 的 算法 。 
c. 你 的 算法 与 用 于 实现 子 集 构造 法 中 使 用 的 e 闭 包 的 关系 如 何 ? 
6. 证 明正 则 语言 的 集合 在 交 运 算 下 封闭 。 


2.5 节 


1. 为 下 面 C 语 言 结 构 构 造 DFA， 然 后 为 它们 中 的 每 一 个 构建 表 驱 动 实现 的 相应 表 : 
a. 整数 常量 。 
b. 标识 符 。 
c. 注释 。 

2. 对 于 上 面 练习 中 的 每 一 个 DFA， 构 建 相应 的 直接 编码 扫描 器 。 

3. 本 章 给 出 两 种 类 型 的 DFA 实 现 : 一 个 是 使 用 选择 语 名 或 开关 语句 的 表 驱 动 实现 ， 另 一 个 是 使 用 分 支 
和 跳 转 的 直接 编码 扫描 器 。 第 三 个 选择 是 使 用 交互 递归 函数 来 实现 扫描 器 。 讨 论 这 样 的 实现 的 优点 
和 缺点。 


第 3 章 


3.2 节 


1. 为 正则 表达 式 的 语法 写 出 一 个 上 下 文 相关 文法 。 

2. 为 上 下 文 无 关 文 法 的 Backus-Naur 形 式 (BNF) 写 出 一 个 上 下 文 无 关 文 法 。 

3. 在 一 次 考试 中 ， 当 被 问 及 非 歧义 性 上 下 文 无 关 文 法 的 定义 上 时， 两 个 学 生 给 出 了 不 同 的 答案 。 第 一 个 学 
生 把 它 定义 为 “一 个 文法 ， 其 中 每 一 个 句子 都 有 由 最 左派 生 的 惟一 语法 树 .” 而 第 二 个 学 生 把 它 定义 
为 “一 个 文法 ， 其 中 每 一 个 句子 都 有 根据 任意 派生 的 惟一 语法 树 。 哪个 是 正确 的 ? 


3.3 节 


1. 下 面 的 文法 不 适合 于 自 顶 向 下 预测 分 析 器 。 找 出 其 中 的 问题 并 通过 重 写 文法 修改 它们 。 证 明 你 的 新 文 
法 满足 LL(1) 条 件 。 
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L 一 Ra R 一 aba Q 一 bbc 
| Q ba | caba | be 
| Robe 
2. 考虑 下 面 的 文法 : 
A —» Ba C 一 cB 
B 一 dab | Ac 
| Cb 


这 一 文法 满足 LL(1) 的 条 件 吗 ? 证 明 你 的 答案 。 如 果 它 不 满足 LL(1) 的 条 件 ， 在 不 改变 这 一 文法 所 描述 
的 语言 的 前 提 下 ， 修 改 这 一 文法 使 其 成 为 LL(1)。 i 

3. 可 以 在 从 左 到 右 的 线性 扫描 的 过 程 中 ， 通 过 向 前 看 个 字符 进行 自 顶 向 下 分 析 的 文法 被 称 为 LL (k) 文 
法 。 在 本 书 中 ，LL(1) 的 条 件 是 用 FIRST 集 合 来 描述 的 。 你 如 何 定义 描述 LL (k) 的 条 件 所 需 的 FIRST 
集合 ? 

4. 假设 一 个 升降 机 是 由 两 个 命令 控制 的 : 人 把 升降 机 向 上 移动 一 层 ， 而 4 把 升降 机 向 下 移动 一 层 。 假 设 建 
筑 物 的 高 度 是 任意 的 ， 且 这 个 升降 机 从 第 * 层 开始 运行 。 

写 出 一 个 LL(1) 文 法 ， 它 生成 满足 下 面条 件 的 任何 指令 序列 : O 从 不 引发 升降 机 到 第 x 层 以 下 ，@ 在 

指令 序列 的 结束 时 总 是 使 升降 机 返回 到 第 x 层 。 例 如 ，f 人 4 和 1 人 4 是 合法 的 指令 序列 ， 但 是 144 和 1 
不 是 合法 的 指令 序列 。 为 方便 起 见 ， 你 可 以 认为 空 序列 是 合法 的 。 证 明 你 的 文法 是 LL(1) 文 法 。 


3.4 节 


1. 自 底 向 上 移入 归 约 分 析 器 的 每 一 次 移动 称 为 一 个 动作 (action)。 这 些 动作 包括 移 人 、 归 约 、 接 受 和 错 
误 动 作 。 当 在 分 析 中 的 给 定点 多 个 动作 可 能 时 ， 引 发 一 个 分 析 冲 突 (parsing conflict). 
” 考虑 在 分 析 器 的 各 动作 间 可 能 出 现 的 所 有 种 类 的 冲突 。 哪 些 种 类 的 冲突 是 可 能 的 ? 哪些 是 不 可 能 
的 ? 陈述 每 一 个 答案 的 正当 性 。 l 
2. 自 顶 向 下 分 析 器 和 自 底 向 上 分 析 器 以 不 同 的 顺序 构建 语法 树 。 编 写 取 一 个 语法 树 ， 并 按 构建 的 顺序 打 
印 结 点 的 一 对 程序 TopDown 和 BottomUp。TopDown 应 该 显示 自 顶 向 下 分 析 器 的 构建 顺序 ， 而 BottomUp 
则 应 该 给 出 自 底 向 上 分 析 器 的 构建 顺序 。 


3.5 节 


1. ClockNoise 语 言 (CN) 是 由 下 面 的 文法 表示 的 : 


Goal + ClockNoise 
ClockNoise — ClockNoisetick tock 
| tick tock 


~ 
w 
一 


a. CN 的 LR(1) 项 目 是 什么 ? 
b. CN 的 FIRST 集 合 是 什么 ? 
c. 构造 CN 的 LR(1) 项 目 集合 的 规范 集合 。 
d. 得 出 ACTION 和 GOTO 表 。 
2. 下 面 的 文法 描述 匹配 括号 语言 。 
Goal — Parens 
Parens — (Parens ) Parens 
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a. 构造 上 面 文法 的 LR(1) 项 目 集合 的 规范 集合 。 
b. 得 出 ACTION 和 GOTO 表 。 
c. 这 一 文法 是 LR(1) 文 法 吗 ? 

. 考虑 下 面 的 文法 : 


wo 


> 

+ 4-44 4d 
w 
OO 


a. 构造 上 面 的 文法 的 LR(1) 项 目 集合 的 规范 集合 。 
b. 得 出 ACTION 和 GOTO 表 。 
c. 这 一 文法 是 LR(1) 文 法 吗 ? 
4. 考虑 接受 两 个 命令 的 机 械 手 ， 防 把 一 个 苹果 放 入 包 中 ， 人 入 从 包 中 取出 一 个 苹果 。 假 设 机 械 手 是 从 空 包 
开始 的 。 
对 于 这 一 机 械 手 的 合法 命令 序列 应 该 满足 任意 前 级 中 入 命 令 的 数目 不 超过 本命 令 的 数目 。 作 为 
BF, V TAANVAV REARS, TVAAVAVAV AANA. 
a. 写 出 表示 这 一 机 械 手 的 所 有 合法 命令 序列 的 LR(1) 文 法 。 
b. 证 明 这 一 文法 是 LR(1) 文 法 。 


3.6 节 

1. 为 包括 二 元 操作 符 (十 和 一 )、 一 元 减 ( 一 )、 自 增 (++) 和 自 减 (--) 且 按 惯例 优先 度 运算 的 表 
达 式 写 出 一 个 文法 。 假 设 不 允许 出 现 重复 的 一 元 减 ， 但 允许 出 现 重复 的 自 增 和 自 减 。 

3.7 节 


1. 考虑 程序 设计 语言 方案 构建 分 析 器 的 任务 。 比 较 自 顶 向 下 归 约 递减 分 析 器 与 表 驱 动 LR〈1) 分 析 器 所 
需 的 努力 。( 假 设 你 已 经 有 一 个 LR(1) 表 生成 器 。) 
2. 本 章 描述 了 消除 文法 中 无 用 产生 式 的 一 个 手工 操作 技术 。 
a. 你 能 修改 LR(1) 表 构造 算法 使 其 自动 地 消除 无 用 产生 式 的 负荷 吗 ? 
b. 即使 一 个 产生 式 在 语法 上 是 无 用 的 ， 它 也 可 能 服务 于 特殊 的 目的 。 例 如 ， 编 译 器 设计 者 可 以 把 一 个 
语法 制导 动作 与 无 用 产生 式 联系 起 来 (如 第 4 章 所 示 )}。 你 的 已 修改 算法 应 该 如 何 处 理 与 无 用 产生 式 
相关 联 的 动作 ? 


第 4 章 
4.2 节 


1. 在 Scheme 中 ，+ 操 作 符 是 重 载 的 。 已 知 Scheme 是 一 个 动态 类 型 语言 ， 描 述 对 形 如 ( + ab) 的 操作 做 
类 型 检查 的 方法 ， 其 中 a 和 b 可 以 是 对 + 合法 的 任意 类 型 。 | 

2. 某 些 语言 ， 例 如 APL 或 RHP， 既 不 需要 变量 声明 也 不 迫使 对 同一 变量 的 赋值 间 的 一 致 性 。( 一 个 程序 
可 以 给 x 冉 一 个 整数 10， 而 后 在 相同 的 作用 域内 再 给 x 赋 串 值 “book”". ) 这 种 程序 设计 风格 有 时 称 为 类 
MRM (type juggling). 
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假设 你 有 某 一 语言 的 已 存在 实现 ， 这 一 实现 没有 声明 但 需要 类 型 一 致 的 使 用 。 你 将 如 何 修改 它 使 其 
允许 类 型 欺骗 呢 ? 
4.3 节 
1. 基于 下 列 评估 规则 ， 画 出 一 棵 注释 分 析 树 以 明示 a - (b+c) 的 语法 树 是 如 何 构建 的 。 


产 生 式 评估 规则 
Eo —> E+T {Eo.nptr e mknode(+,F£,.nptr,T.nptr) } 
Eo > Ei-T {Eo.nptr e mknode(-,E,.nptr,T.nptr) } 
Eo > 了 { Eo.nptr e T.nptr } 
T > (E) { T.nptr + E.nptr } 
T > 


id { T.nptr — mkleaf(id,id.entry) } 


2. 使 用 属性 文法 范例 写 出 一 个 经 典 表达 式 文 法 的 解释 器 。 假 设 每 一 个 ident 有 一 个 value 属 性 和 一 个 

name 属 性 。 假 设 所 有 属性 已 被 定义 ， 且 所 有 值 将 总 有 相同 类 型 。 
3. 写 出 一 个 文法 来 描述 所 有 4 的 倍数 的 二 进 制 数 。 把 属性 规则 加 到 这 一 文法 中 ， 它 用 该 二 进 制 数 的 十 进 

制 值 为 value 属 性 注释 语法 树 的 开始 符号 。 
4. 使 用 前 面 练习 所 定义 的 文法 ， 构 建 二 进 制 数 11100 的 语法 树 。 

a. 使 用 相应 的 值 给 出 此 树 中 所 有 的 属性 。 

b. 画 出 这 一 语法 树 的 属性 相关 图 并 将 所 有 属性 分 类 综合 或 继承 属性 。 


4.4 节 
1. 在 Pascal 中 ， 程 序 员 可 以 使 用 下 面 的 语法 来 声明 两 个 整 型 变量 a 和 b。 


var a, b: int 
这 一 声明 可 以 使 用 下 面 的 文法 来 描述 。 
VarDecl — varIDList : TypelD 
IDList. “+ IDList,ID 
-1 bp 
其 中 1DList 派 生 一 个 用 逗号 分 隔 的 变量 名 列表 ， 而 1ypeID 派 生 一 个 合法 的 Pascal 类 型 。 你 可 能 发 
- 现 有 必要 重 写 这 一 文法 。 
a. 写 出 一 个 属性 文法 ， 使 其 给 每 一 个 声明 变量 赋 一 个 正确 的 数据 类 型 。 
b. 写 出 一 个 专用 语法 制导 翻译 方案 ， 使 其 给 每 一 个 声明 变量 冉 一 个 正确 的 数据 类 型 。 
c. 这 两 个 方案 可 以 通过 在 语法 树 上 的 单一 遍 来 操作 吗 ? 

2. 有时， 编译 器 设计 者 可 以 跨越 上 下 文 无 关 和 上 下 文 相 关 分 析 间 的 边界 移动 一 个 问题 。 例 如 ， 考 虑 
FORTRAN 77 中 函数 调用 和 数组 引用 间 发 生 的 典型 歧义 性 问题 。 使 用 下 列 产生 式 可 以 将 这 些 构 造 加 入 
到 经 典 表达 式 文法 中 。 

Factor ~ ident ( ExprList ) 
ExprList -+ ExprList , Expr 
| Expr 


在 这 里 ， 函 数 调用 和 数组 引用 之 间 的 惟一 差别 在 于 如 何 声明 ident。 
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在 前 一 章 ， 我 们 讨论 了 使 用 扫描 器 与 分 析 器 间 的 合作 来 解除 这 些 构造 中 的 歧义 性 。 这 一 问题 可 以 
在 上 下 文 相 关 分 析 期 间 加 以 解决 吗 ? 哪 种 解决 方案 更 好 ? 


.有 时 ， 语 言 描述 使 用 上 下 文 相 关机 制 检查 可 以 使 用 上 下 文 无 关 方 法 测试 的 性 质 。 考 虑 图 4-15 的 文法 片 


段 。 事 实 上 ， 虽 然 标 准 把 声明 限制 在 单一 StorageClass 说 明 符 上 ， 但 这 一 文法 片段 允许 任意 数量 的 

StorageClass 说 明 符 。 

a. 重 写 这 一 文法 以 在 文法 上 实施 这 一 限制 。 

b. 同样 地 ， 这 一 语言 只 允许 TypeSpecifier 的 特定 组 合 。1ong 只 能 与 int 或 float 组 合 ; short 只 能 与 int 
组 合 。signed 或 者 unsigned 可 以 出 现 于 int 的 任意 形式 。signed 还 可 以 出 现在 char 上 。 这 些 限 制 可 
以 写 人 文法 中 吗 ? 

c. 提出 一 个 为 什么 作者 这 样 构 造 这 个 文法 的 解释 。( 提示: 扫描 器 为 任意 的 StorageClass 值 返回 单一 记 
号 类 型 ， 为 任意 的 TypeSpecifiers 返 回 另 一 个 记号 类 型 .) 

d. 你 的 这 一 文法 的 版 本 改变 这 一 分 析 器 的 整体 速度 吗 ? 在 构建 C 语 言 的 分 析 器 中 ， 你 将 使 用 如 图 4-15 
的 文法 ， 还 是 更 喜欢 你 的 改编 文法 呢 ? 给 出 你 的 答案 的 正当 性 。 


4.5 节 


1. 


面向 对 象 语言 允许 操作 符 和 函数 重 载 。 在 这 些 语言 中 ， 函 数 名 字 不 总 是 惟一 的 标识 符 ， 因 为 你 可 以 有 


多 个 相关 的 定义 ， 如 用 下 面 的 形式 : 


void Show(int); 
void Show(char *); 
void Show(float); 
为 了 查找 的 目的 ， 编 译 器 必须 为 每 一 个 函数 构造 不 同 的 标识 符 。 有 时 候 ， 这 样 的 重 载 函数 还 有 不 
同 的 返回 值 。 你 如 何 为 这 样 的 函数 创建 不 同 的 标识 符 ? 


2. 继承 可 能 为 面向 对 象 语言 的 实现 带 来 问题 。 当 对 象 类 型 4 是 对 象 类 型 B 的 一 个 双亲 时 ， 使 用 形 如 ab 


的 语法 ， 程 序 可 以 把 “指向 B 的 指针 ” 赋 给 “指向 A 的 指针 "。 这 将 不 会 引发 问题 ， 因 为 4 能 做 的 每 一 
件 事 B 也 能 做 。 然 而 ， 你 却 不 能 把 “指向 4 的 指针 ” 赋 给 “指向 B 的 指针 ”"， 因 为 对 象 类 B 可 以 实现 对 象 
类 4 没有 实现 的 方法 。 

设计 一 种 机 制 ， 它 可 以 使 用 专门 语法 制导 翻译 来 决定 这 种 指针 赋值 是 否 被 允许 。 


第 5 章 
5.3 节 
1. 说 明 如 何 用 抽象 语法 树 ， 控 制 流 图 和 四 元 组 表示 下 面 的 代码 片段 。 讨 论 每 一 种 表示 的 优点 。 对 于 什么 


样 的 应 用 ， 一 种 表示 可 能 比 其 他 表示 更 优越 ? 


if (c{i] # 0) 
then a[i] + b[i] + c[i]; 
else a[i] + bfi]; 


2. 检查 下 面 的 程序 ， 画 出 它 的 CFG 并 以 线性 代码 给 出 它 的 SSA 形 式 。 


X 4- 


bad 


ae y+t2 
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while(x < a) 
if (y <x) 
xeytl 
yebx2 
else 
xeyt2 
yeat2; 
wex+2 
zeyxa 
yeyrtl 


5.4% 


1. 说 明 如 何 将 表达 式 x~2 x y 翻 译 成 抽象 语法 树 、 静 态 单一 赋值 形式 、 单 地 址 代码 、 二 地 址 代码 和 三 地 址 
代码 。 


5.5 节 


1. 考虑 下 面 用 C 语 言 写成 的 三 个 过 程 : 738 

static int max = 0; int Bint k 

void A(int b, int e) f (int k) 

{ i . 
int a, c, d, p; int x, y3 
a = B(b); x= pow (2, k); 

y=x*5; 
if tb > 100) { return y; 
d=c*5+e; } 
se . void C(int *p) 
c=axhb; 
*p = c; if (*p > max) 
c (8p); } max = is 

} 

a. 假设 编译 器 是 根 滑 寄存 器 到 寄存 器 内 存 模型 工作 的 。 编译 器 将 迫使 过 程 A、B 和 (5 中 电 些 变量 存储 于 
ATH? 证 明 你 的 答案 。 

b. 假设 编译 器 是 根据 内 存 到 内 存 模型 工作 的 。 考虑 1f- el1se 结 构 中 if 子 语句 的 两 个 语句 的 执行 。 如 果 
编译 器 在 计算 的 那个 地 点 有 两 个 寄存 器 可 用 ， 那 么 在 执行 这 两 个 语句 期 间 ， 为 了 把 值 带 到 寄存 器 中 
并 再 把 它们 带 回 到 内 存 ， 编 译 器 将 需要 发 行 多 少 个 装 和 信和 存储 操作 ? 如 果 有 三 个 寄存 器 可 用 ， 那么 
结果 将 会 如 何 ? | 

2. 在 FORTRAN 中 ,使 用 equivalence 语 句 可 以 迫使 两 个 变量 从 同一 个 存储 位 置 开 始 。 例 如 ， 下 面 的 语 

名 迫使 a 和 b 共 享 存储 : 

equivalence (a,b) 

如 果 一 个 局 部 变量 在 equivalence 语 句 中 出 现 ， 编 译 器 能 在 整个 过 程 中 把 这 个 局 部 变量 保存 在 寄存 器 


中 吗 ? 证 明 你 的 答案 。 739 


5.7 节 


1. 编译 器 的 某 个 部 分 必须 负责 把 每 一 个 标识 符 放 和 符号 表 中 。 
a. 扫描 器 或 分 析 器 应 该 把 标识 符 放 入 符号 表 中 吗 ? 它们 都 有 机 会 这 样 做 。 
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b. 这 一 问题 、 声 明 前 使 用 原则 ， 以 及 在 含有 FORTRAN 77 这 样 的 歧义 性 的 语言 中 ， 函 数 调用 中 的 下 标 
的 歧义 性 消除 之 间 存 在 相互 作用 吗 ? 
. 编译 器 必须 把 信息 存储 于 程序 的 IR 版 本 中 ， 使 它 可 以 取 回 每 一 个 名 字 的 符号 表 入 口 。 编 译 器 设计 者 可 
做 的 选择 包括 指向 源 字符 串 的 指针 和 进入 符号 表 的 下 标 。 当 然 ， 聪 明 的 实现 者 也 许 会 发 现 其 他 选择 。 
名 字 的 两 种 表示 方法 各 有 什么 优 缺 点 ?你 将 如 何 表 示 名 字 ? 
. 你 正在 为 你 喜欢 的 词法 作用 域 语言 编写 编译 器 。 
考虑 下 面 的 示例 程序 : 


TF procedure main 
integer a, b, c; 
procedure f1(w,x); 
integer a,x,y; 
call f2(w,x); 
end; 
procedure f2(y,z) 
integer a,y,z; 
28. procedure f3(m,n) 
10 integer b, m, n; 


N 


W 





ll c=a*b*eme*«n; 
12 end; 

33 call f3(c,z); 

14 end; 

16 call fl(a,b); 

n end; 


a. 画 出 这 一 程序 的 符号 表 和 它 在 第 11 行 的 内 容 。 
b. 当 分 析 器 进入 一 个 新 的 过 程 以 及 当 它 离开 一 个 过 程 时 ， 符 号 表 管理 需要 什么 动作 ? 
4. 决定 下 面 C++ 程 序 的 输出 : 
int i = 2; 
while (i == 2) { 

lo 
int i = 2; 
itt: 
cout << į << " '"; 


cout << j << "\n"; 
5. 符号 表 最 常用 的 实现 技术 是 散 列表 ， 其 中 插入 和 删除 的 期 望 代价 是 0(1)。 


a. 散 列表 中 的 插入 和 删除 的 最 坏 情 况 是 什么 ? 
b. 提出 另外 一 个 实现 方案 ， 它 保证 O(D) 的 插入 和 删除 。 
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6.2 节 


1. 考虑 下 面 的 C 程 序 。 


int Sub(int i, int j) { 
return i - j; 
} 


int Mul(int i, int j) { 
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return i * j; 
} 741 
int Delta(int a, int b, int c) { 
return Sub(Mul(b,b), Mul (Mul (4,a),c)); 
} 
void main() { 
int a, b, c, delta; 
scanf("%d %d %d", &a, &b, &c); 
delta = Delta(a, b, c); 
if (delta == 0) 
puts("Two equal roots"); 
else if (delta > 0) 
puts("Two different roots"); ` 
else 
puts("No root"); 
} 


给 出 它 的 调用 树 和 执行 历史 。 
2. 考虑 下 面 的 C 程 序 。 


void Output (int n, int x) { 
printf("The value of %d! is %s.\n", n, x); 


} 


int Fat(int n) { 
int x; 
if (n> 1) 
x = n + Fat(n - 1); 
else 
x=]; 
Output(n, x); 
return x; 


} 


void main() { 
Fat (4); 
} 


给 出 它 的 调用 树 和 执行 历史 。 . 742 


6.355 


1. 某 些 程序 设计 语言 允许 程序 员 在 局 部 变量 的 初始 化 中 使 用 函数 ， 但 在 全 局 变量 的 初始 化 中 却 不 能 使 用 
函数 。 
a. 是 否 存在 解释 语言 定义 中 这 看 似 不 合 情 理 现象 的 实现 上 的 解释 ? 
b. 允许 使 用 函数 的 调用 结果 来 初始 化 全 局 变量 所 需要 的 机 制 是 什么 ? 
2. 编译 器 设计 者 可 以 用 若干 种 方式 优化 AR 分 配 。 例 如 ， 编 译 器 可 以 : 
a. 静态 地 分 配 叶 过 程 (也 就 是 那些 无 过 程 调用 的 过 程 ) 的 AR。 
b. 把 那些 总 是 一 起 被 调用 的 过 程 的 AR 结 合 起 来 。( 当 a 被 调用 时 ， 它 总 是 调用 p。 ) 
c. 取代 AR 的 堆 分 配 ， 使 用 实 存 块 风格 的 分 配器 。 
对 于 每 一 个 方案 ， 考 虑 下 面 的 问题 : 
a. 哪些 调用 可 以 受益 ? 最 好 的 情况 下 如 何 ? 最 坏 的 情况 下 又 如 何 ? 
b. 对 运行 时 间 空 间 运 用 产生 什么 影响 ? 
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3. 考虑 下 面 的 Pascal 程 序 ， 其 中 只 给 出 了 过 程 调用 和 变量 声明 。 


program Main(input, output); 
var a, b, c : integer; 
procedure P4; forward; 
procedure P1; 
procedure P2; 
begin 
end; 
var b, d, f : integer; 
procedure P3; 
var a, b : integer; 
begin 
P2; 
end; 
begin 
P2; 
P4; 
P3; 
end; 
var d, e : integer; 
procedure P4; 
var a, C, g : integer; 
procedure P5; 
var c, d : integer; 
begin 
Pl; 
end; 
var d : integer; 
begin 
Pl; 
P5; 
end; 
begin 
piz 
P4; 
end. 


a. 构造 类 似 于 图 6-3 的 静态 坐标 表 。 
b 构造 表示 程序 中 仍 套 关系 的 图 。 
c. 构造 表示 程序 中 调用 关系 的 图 。 
4. 画 出 编译 器 为 支持 如 下 定义 的 类 型 Dumbo 的 对 象 所 需 生 成 的 结构 : 


class Elephant { 
private int Length; 
private int Weight; 
static int type; 





public int GetLen(); 
public int GetTyp(); 
} 


class Dumbo extends Elephant { 
private int EarSize; 
private boolean Fly; 


public boolean CanFly(); 
} 
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6.47 


. 在 程序 设计 语言 中 ,不 同 变量 引用 同一 个 对 象 (内 存 区 域 ) 的 情况 被 认为 是 不 理想 的 。 考 虑 下 面 通过 
引用 传递 参数 的 Pascal 过 程 。 


procedure mystery(var x, y : integer); 
begin 
xX := x+y; 
Ye 
X t= X= Y3 
end; 


如 果 上 溢 或 下 溢 不 在 算术 操作 中 出 现 ， 那 么 : 


a. 当 我 们 使 用 不 同 变量 a 和 b 调 用 mystery 时 ， 它 将 产生 什么 样 的 结果 ? 
b. 如 果 我 们 在 调用 mystery 时 把 一 个 变量 同时 传送 到 两 个 参数 ， 那 么 期 望 的 结果 将 是 什么 ? 在 这 种 情 


一 





况 下 ， 真 实 结果 又 是 什么 ? 745 
2. 考虑 下 面 的 类 Pascal 伪 程序 设计 语言 中 的 程序 。 模 拟 它 在 值 调用 、 引 用 调用 、 名 字 调 用 和 值 结果 调用 
规则 下 的 执行 。 给 出 上 述 每 种 情况 下 打印 语句 的 结果 。 
i procedure main; 
var a : array[1...3] of int; 
1.2 inti 
procedure p2(e : int); 
begin 
e:=e+ 3; 
ali] := 5; 
1 := 23 
e:=e+ 4; 
end; 
begin š 
a := [1, 10, 77]; 
i ads 
p2(a[i]); 
for i := 1 to 3 do 
print (a[i]); 
end. 
6.55 4 
1. 假设 一 个 Pascal 语 言 实现 的 AR 是 以 图 表 a 所 示 形 式 分 配 的 栈 。( 为 简单 起 见 ， 我 们 省 略 了 某 些 域 。) 
ARP 是 指向 AR 的 惟一 指针 ， 所 以 存 取 链 是 之 前 的 ARP 值 。 这 个 栈 向 本 页 顶部 增长 。 图 表 b 给 出 计算 的 
初始 AR 。 
“ARP 
b) 初始 状态 i 





对 于 下 面 的 Pascal 程 序 ， 画 出 从 函数 F1 返 回 之 前 在 这 一 栈 上 的 AR 集合 。 把 所 有 条 目 都 放 和 这些 
AR 中 。 使 用 行 编号 表示 返回 地 址 。 画 出 存 取 链 的 有 向 弧 。 标 清 局 部 变量 和 参数 的 值 。 以 每 一 个 AR 的 


436 k J 


程序 名 标示 这 个 AR。 


program main(input, output) ; : 
procedure P1( function g(b: integer): integer); 
var a: integer; 
begin 
a := 3; 
writeln(g(2)) 
end; 
procedure P2; 
var a: integer; 
function Fl(b: integer): integer; 
begin 
Fl :=a+b 
end; 
procedure P3; 
var a:integer; 
begin 
a:=7; 
P1(F1) 
end; 
begin 








2. 考虑 下 面 的 Pascal 程 序 。 假 设 AR 遵从 与 前 面 问题 相同 的 布局 ， 且 有 相同 的 初始 条 件 ， 只 是 实现 使 用 全 
747 局 显示 而 非 存 取 链 。 


program main(input, output); 
var x : integer; 
a: float; 
procedure pl(); 
var g:character; 
begin 
end; 
procedure p2(); 
var h:character; 
procedure p3(); 
var h,i:integer; 
begin 
pl(); 
end; 
begin 
p3(); 
end; 
begin 
p2(); 
end 





画 出 当 这 一 程序 达到 过 程 p1 中 的 第 7 行 时 ， 在 运行 时 栈 上 的 AR 集合 。 





2% J 437 


6.675 


1. 链接 约定 的 概念 与 大 程序 结构 之 间 有 什么 关系 ?与 中 间 语 言 有 什么 关系 ? 链接 约定 如 何 提供 中 间 语 言 
调用 ? 

2. 假设 编译 器 能 够 分 析 代 码 确 定 诸如 “从 这 一 点 开始 ， 变 量 v 在 这 一 过 程 中 不 再 使 用 ”或 者 “变量 v 在 这 
一 过 程 的 下 一 次 使 用 是 在 第 11 行 ,” 等 事实 ， 且 假设 编译 器 把 下 面 三 个 过 程 的 所 有 局 部 变量 都 保存 在 
寄存 器 中 。 748 
procedure main 

integer a, b, c 
b=a+c; 
c = fl(a,b); 
call print(c); 
end; 
procedure fi(integer x, integer y) 
integer v; 
VEX * y; 
call print(v); 
call f2(v); 
return -x; 
end; 
procedure f2(integer q) 
integer k, r; 


k=q/r; 

end; 
a. 过 程 f1 中 的 变量 x 在 两 个 过 程 调 用 间 是 活着 的 。 为 使 编译 代码 的 执行 最 快 ， 编 译 器 应 该 把 这 一 变量 

保留 在 调用 者 存储 寄存 器 还 是 被 调用 者 存储 寄存 器 呢 ? 证明 你 的 答案 。 
b. 考虑 过 程 main 中 的 变量 a 和 c。 再 次 假设 编译 器 尝试 最 大 化 编译 代码 的 速度 。 这 时 ， 编 译 器 应 该 把 a 

和 c 保 留 在 调用 者 存储 寄存 器 还 是 被 调用 者 存储 寄存 器 呢 ? 证 明 你 的 答案 。 749| 


6.7 节 


1. 考 虑 带 有 局 部 变量 和 参数 的 尾 递 归 函 数 。 描 述 一 个 存储 机 制 ， 它 消除 对 栈 分配 活 动 记录 的 需求 。 
2. C 语 言 的 类 型 系统 的 什么 性 质 使 得 自动 垃圾 回收 变 得 困难 ? 
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7.2 节 


1. 内 存 布局 影响 指定 给 变量 的 地 址 。 假 设 字 符 变量 没有 调整 限制 ， 短 整数 变量 必须 调整 到 半 字 (2 字 节 ) 
边界 ， 整 数 变 量 必须 调整 到 字 (4 字 节 ) 边界 ， 长 整数 变量 必须 调整 到 双 字 (8 字 节 ) DAR. SETH 
的 声明 集合 。 

Char ai 
long int b; 
int c; 
short int d; 


long int e; 
char f; 


画 出 这 些 变量 的 内 存 映射 : 
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a. 假设 编译 器 无 法 对 这 些 变 量 做 重 排序 。 
b. 假设 编译 器 可 以 为 节省 空间 而 对 这 些 变 量 重 排序 。 
2. 对 于 下 面 的 每 一 类 变量 , 说 明 编译 器 可 以 为 这 样 的 变量 分 配 的 内 存 空间 位 置 。 可 能 的 答案 包括 寄存 器 、 
活动 记录 、( 带 有 不 同 可 视 性 的 ) 静态 数据 区 域 和 运行 时 堆 。 
a. 局 部 于 过 程 的 变量 。 


b 全 局 变量 。 
c. 动态 分 配 的 全 局 变量 。 
d. 形式 参数 。 
e. 编译 器 生成 的 临时 变量 。 
7.3 节 
1. 使 用 7.3 节 的 树 遍历 代码 生成 算法 为 下 面 的 表达 式 树 构建 杆 素 代码 。 假 设 对 寄存 器 数目 没有 限制 。 
“™ 
KA Sy, 
/NN 


oN 
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2. 寻找 使 用 ILOC 指 令 集合 评估 下 面 的 树 所 需要 的 寄存 器 的 最 小 数目 。 对 于 每 一 个 非 叶子 结 点 ， 指 出 为 
了 得 到 寄存 器 的 最 小 数目 ， 哪 一 个 孩子 必须 先 评估 。 


AN. N 
ZX, AN. 
Nya N. Z/N, 
£N ssn 
a C x y 
a) b) 


3. 使 用 标准 优先 度 和 从 左 到 右 评估 构建 下 面 两 个 算 示 表达 式 的 表达 式 树 。 计 算 使 用 ILOC 指 令 集合 评估 
每 一 个 表达 式 树 所 需要 的 寄存 器 的 最 小 数目 。 
a. ((a +b) + (c + d)) + ((e + f) + (g+ h)) 
batb+tct+tdtetf+gth 
7.45 
1. 为 下 面 代码 序列 生成 判定 LOC。!( 在 解答 中 不 应 出 现 分 支 指令 。) 
if (x < y) 
then z = x * 5; 
else z = y + 5; 
w=z+ 10; 
2. 如 7.4 节 所 述 ， 下 面 的 C 语 言 的 表达 式 的 短路 代码 避 开 潜在 的 除 零 错 误 。 


al=08&&b/a>0O.5 
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如 果 源 语言 的 定义 不 对 布尔 值 表达 式 定 义 短路 评估 ， 那 么 编译 器 为 了 优化 能 够 为 这 样 的 表达 式 生 
成 短路 代码 吗 ? 可 能 出 现 什么 样 的 问题 ? | 


7.5 节 


1. 对 于 按 行 优先 存储 的 字符 数组 A[10. . .12，1.. .3]， 在 生成 的 代码 中 至 多 使 用 四 个 算术 运算 计算 引用 


A[i，j] 的 地 址 。 


2. 什么 是 内 情 向 量 ? 给 出 上 面 问题 中 的 字符 数组 的 内 情 向 量 的 内 容 。 为 什么 编译 器 需要 内 情 向 量 ? 

3. 在 实现 C 语 言 的 编译 器 时 ， 使 编译 器 执行 数组 引用 的 区 域 检查 是 明智 的 吗 ? 假设 使 用 区 域 检查 且 C 语 
言 程序 的 所 有 数组 引用 都 成 功 地 通过 这 些 检 查 ， 这 个 程序 可 能 存 取 数 组 区 域外 的 存储 区 域 吗 ? 例如 ， 
对 于 一 个 声明 为 下 界 为 零 、 上 界 为 N 的 数组 A， 存 取 AL[-1] 是 否 可 能 ? 


7.6 节 


1. 考虑 下 面 7.6.2 节 中 的 字符 拷贝 循环 : 


do { 


load! 
loadI 


loadI 


Li: cload 


@b => ræ // get pointers 


@a => Tea 


NULL = rı // terminator 


To => rz // get next char 


estore rz => rea // store it 


Fatt = *b++; addI 

} while (*b!='\0') addI 
cmp-NE 

cbr 

Lz: nop 


rebel = reb // bump pointers 


Teasl => Toa 


Pir? => Va 


re 一 Li,L2z 


// next stmt 


修改 这 一 代码 ， 使 得 它 对 于 任意 超出 a 的 分 配 长 度 的 企图 分 支 到 Lso, 处 的 出 错 处 理 器 。 假 设 a 的 分 
配 长 度 被 作为 无 符号 四 字 节 整数 存储 于 距 a 的 开始 偏 移 为 - 8 的 地 方 。 
2. 考虑 下 面 的 申 赋值 a =b 的 实现 ， 如 7.6 节 所 示 。 对 于 申 a 和 b， 它 假设 串 的 实际 长 度 存储 于 距 该 目的 开 
“ 始 偏 移 为 - 4 的 地 方 ， 而 且 那 个 串 的 分 配 长 度 都 存储 于 距 该 串 的 开始 偏 移 为 - 8 的 地 方 。 


li: 


Le: 


load! @b 
loadAI Teb -4 
loadI @a 
loadAI  reas-8 
cmp_LT T2) 
cbr r3 
loadl 0 


cmp-LT Tae} 
cbr rs 
cloadAO reb,ra 
cstoreAd re 
addI resl 


cmp-LT Yaoi 


=> Teb 
= 六 

=> Tea 
=> M 

=> 13 

> bsov sti 
=> r4 

=> Ts 

一 Lz ,1L3 
=> T6 

=> earls 
=> 4 


= 17 


// get b's length 


// get a's length 
// will b fit in a? 
// Lsov raises error 
// counter 

// more to copy ? 


// get char from b 
// put it ina 
// increment offset 


// more to copy ? 


~J 
W 
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cbr ry 一 Lets 


ta: nop > // next statement 


它 使 用 两 个 cmp/ycbr 对 来 实现 循环 结束 测试 ， 一 个 在 标签 为 Li 的 块 中 ， 一 个 在 标签 为 L: 的 块 中 。 

在 一 个 编译 代码 的 尺寸 非常 重要 的 环境 中 ， 编 译 器 可 能 要 用 到 LL 的 jumpI 取 代 循环 尾部 的 cmp/cbr 对 。 

这 样 的 改变 是 如 何 影响 循环 的 执行 时 间 的 ? 存在 在 其 上 运行 更 快 的 机 器 模型 吗 ? 存在 在 其 上 运行 
较 慢 的 机 器 模型 吗 ? 


3. 图 7-9 给 出 如 果 使 用 面向 字 的 内 存 操作 来 执行 两 个 字 对 齐 串 的 字符 串 赋值 。 任 意 赋 值 可 能 生成 非 对 齐 
情况 。 
754 a. 写 出 你 希望 你 的 编译 器 为 任意 PL/I 风 格 的 字符 赋值 发 行 的 ILOC 代 码 ， 例 如 赋值 为 
fee(i:j) = fie(k:1); 
其 中 j-i=1-k。 这 一 语句 把 fie 中 从 位 置 k 到 位 置 1 的 字符 拷贝 到 串 fee 中 从 i 到 j 的 位 置 中 。 
包括 使 用 面向 字符 的 内 存 操作 版 本 和 使 用 面向 字 的 内 存 操作 版 本 。 你 可 以 假设 fee 和 fie 在 内 存 内 
PZE. 
b. 程序 员 可 以 创建 交 迭 的 字符 串 。 在 PL/I 中 ， 程 序 员 可 以 书写 
fee(i:j) = fee(i+1:j+1); 
或 ， 其 至 更 恶劣 地 书写 
fee(itk:jtk) = fee(i:j); 
这 如 何 复杂 化 编译 器 为 字符 赋值 必须 生成 的 代码 ? 
c. 存 在 编译 器 运用 于 各 种 字符 拷贝 循环 以 改进 运行 时 行为 的 优化 吗 ? 它们 有 什么 帮助 ? 
7.7 节 
1. 考虑 下 面 的 C 语 言 类 型 声明 : 
struct $1 { 
struct S2 { union U { int a; 
int i; float r; double b; 
int f; struct S2; union U; 
}; }; int d; 
755 p , 
为 51 构 筑 一 个 结构 元 素 表 。 在 其 中 包括 所 有 编译 生成 对 类 型 51 的 变量 元 素 的 引用 时 所 需 的 所 有 信息 ， 
包括 每 一 个 元 素 的 名 字 、 长 度 、 偏 移 和 类 型 。 
2. 考虑 下 面 的 C 语 言 声 明 : 


struct record { 
int StudentId; 
int Courseld; 
int Grade; 

} grades [1000] ; 

int g, i; 


说 明 编 译 器 为 了 把 变量 g 中 的 值 作为 9rade 的 第 i 个 元 素 的 grade 存 储 时 所 生成 的 代码 ， 假 设 : 
a. 数组 grade 被 作为 结构 数组 存储 。 
b. 数组 grade 被 作为 数组 结构 存储 。 
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7.85 


1. 作为 一 名 程序 员 ， 你 关注 于 你 所 生成 的 代码 的 效率 。 你 最 近 手工 实现 了 一 个 扫描 器 。 这 个 扫描 器 把 大 
部 分 时 间 耗 费 在 包含 一 个 大 选择 语句 的 whi1e 循 环 上 。 
a. 选择 语句 的 不 同 实现 技术 是 如 何 对 你 的 扫描 器 的 效率 产生 影响 的 ? 
b. 你 将 如 何 改变 你 的 源 代码 以 便 改 进 在 选择 语句 的 每 一 个 实现 策略 下 你 的 运行 时 性 能 ? 
2. 把 下 面 的 C 语 言 中 的 尾 递 归 函 数 转换 成 循环 。 756 
List * last(List *1) { 
if (1 == NULL) 
return NULL; 
else if (1->next == NULL) 
return 1; 


else 
return last(1->next); } 


7.9% 


1. 假设 xz 是非 歧义 、 局 部 整 型 变量 ， 且 x 作 为 在 它 被 声明 过 程 中 的 一 个 引用 调用 实 参 被 传递 。 因 为 它 是 局 
部 且 是 非 歧 义 的 ， 所 以 在 它 的 生存 期 内 ， 编 译 器 可 能 设法 把 它 保 存在 一 个 寄存 器 中 。 因 为 它 被 作为 一 
个 引用 调用 参数 传递 ， 所 以 在 调用 点 它 必 须 有 一 个 内 存 地 址 。 

a. 编译 器 应 该 把 x 存储 在 哪里 ? 
b. 在 调用 场所 ， 编 译 应 该 如 何 处 理 x? 
c. 如 果 x 是 作为 一 个 值 调用 参数 被 传递 的 ， 你 的 答案 将 做 如 何 改 变 ? 

2. 链接 约定 是 编译 器 与 任意 编译 代码 的 外 部 调用 者 之 间 的 一 种 契约 。 它 创建 可 以 用 于 调用 一 个 过 程 并 得 
到 这 一 过 程 返回 的 任意 结果 (同时 保护 调用 者 的 运行 时 环境 ) 的 已 知 接口 。 因 此 ， 只 有 当 一 个 对 链接 
约定 的 违规 不 能 被 编译 代码 的 外 部 发 现时 ， 编 译 器 才 可 以 做 这 一 违规 操作 。 

a. 在 什么 样 的 情况 下 编译 器 可 以 肯定 使 用 不 同 的 链接 是 安全 的 ? 给 出 一 个 真实 程序 设计 语言 中 的 例子 。 
b. 在 上 述 这 些 情况 下 ， 编 译 器 可 以 怎样 改变 调用 序列 和 链接 约定 ? 757 


7.10 节 


1. 解释 在 类 记录 中 第 一 域 的 目的 ， 诸 如 图 7-13 中 的 sc、mc 和 giant。 

2. 在 Java 语 言 中 ， 数 据 成 员 的 存 取 规则 不 同 于 方法 成 员 的 存 取 规则 。 例 如 ， 假 设 类 b 继 承 自 类 a， 且 这 两 
个 类 都 定义 了 名 为 f00 的 成 员 。 进 一 步 假 设 对 象 是 作为 类 b 的 一 个 实例 分 配 的 ， 但 是 当 存 取 它 的 成 员 
foo 时 ， 它 被 处 理 为 类 a 中 的 对 象 。 如 果 foo 是 一 个 方法 成 员 , 那么 调用 解析 为 类 b 中 定义 的 方法 。 但 是 ， 
如 果 foo 是 一 个 数据 成 员 ， 那 么 将 对 类 a 中 定义 的 域 做 存 取 。 

解释 你 如 何 实现 支持 这 两 种 不 同 存 取 规则 的 Java 编 译 器 。 

3. 多 重 继承 的 某 些 实现 把 “蹦床 函数 ”用 于 调整 对 象 记录 指针 ， 如 7.10.2 节 所 述 。 

a. 什么 时 候 代码 需要 调整 在 Java 中 用 this 表 示 的 对 象 记录 指针 ? 
b. 什么 样 的 类 需要 多 重 蹦床 函数 ， 即 带 有 不 同 偏 移 的 蹦床 函数 ? 

4. 在 以 动态 类 结构 为 特征 的 程序 设计 语言 中 ， 必 须 动 态 分 配 的 方法 调用 的 数量 可 能 很 大 ， 其 中 动态 类 结 
构 是 运行 时 可 以 变化 的 类 结构 。 如 7.10.2 节 中 所 述 ， 方 法 缓冲 可 以 绕 过 它们 而 减 小 这 些 查找 的 运行 时 
代价 。 

作为 对 多 局 方法 缓冲 的 一 种 替代 ， 实 现 可 以 在 每 一 个 调用 场所 维护 一 个 人 口 方法 缓冲 。 它 记录 该 
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调用 场所 最 近 发 行 的 方法 的 地 址 ， 以 及 相关 的 类 。 
开发 使 用 及 维护 这 样 的 内 联 方法 缓冲 的 伪 代 码 。 解 释 这 个 内 联 方法 缓冲 的 初始 化 和 对 支持 内 联 方 
758 法 缓冲 所 需 的 一 般 方法 查找 程序 的 修改 。 


第 8 章 
8.3 节 


1. 很 多 优化 和 代码 生成 算法 被 设计 成 在 DAG 上 操作 。 即 使 是 使 用 低级 IR 的 编译 器 ， 如 ILOC 优 势 也 构建 

DAG. 

a. 草拟 一 个 从 ILOC 表 示 的 基本 块 构建 DAG 的 算法 。 

b. 将 你 的 算法 与 图 8-3 所 示 的 值 编号 算法 做 比较 。 

c. 草拟 一 个 从 你 的 DAG 重 新 生成 ILOC 的 算法 。 

d. 你 能 否 扩展 你 的 DAG 构 造 算法 使 其 包含 值 编号 的 某 些 其 他 属性 ， 诸 如 常量 肥 入 或 处 理 代数 等 式 ? 
2. 考虑 下 面 的 两 个 基本 块 : 

atb+< atbte 

dec e«ccte 

eect+d feate 

featd gebte 

g¢+ bte hebte 

hebt+d 


a. 构筑 每 一 个 块 的 DAG。 
b. 值 编号 每 一 个 块 。 
c. 解释 由 以 上 两 个 技术 在 寻找 元 余 中 的 差异 。 
759 d. 在 每 一 个 块 的 尾 端 ，f 和 g 有 相同 的 值 。 为 什么 这 些 算法 很 难 发 现 这 一 事实 ? 
3. 给 定 一 个 ILOC 操 作 的 线性 列表 ， 开 发 一 个 寻找 基本 块 的 算法 。 扩 展 你 的 算法 构筑 表示 块 间 关系 的 控 


制 流 图 。 

8.4 节 

1. 考虑 下 面 的 控制 流 图 : 
(1) 
© 0 
ACG © 
O © 
Q 0 
GY 


a. 识别 上 图 中 的 扩展 基本 块 。 
b. 识别 出 上 图 中 的 循环 。 
c. 写 出 C 语 言 中 可 以 生成 上 面 的 控制 流 图 的 过 程 。 
2. 给 出 一 个 算法 ， 这 一 算法 可 以 高 效 地 确定 被 包含 在 一 个 循环 L 内 的 基本 块 集合 。 假 设 给 你 控制 流 图 中 
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的 循环 结束 边 (也 就 是 目标 支配 源头 的 边 )。 例 如 ， 上 图 中 从 7 到 4 的 边 和 8 到 3 的 边 都 是 上 一 问题 中 
CFG 的 循环 结束 边 。 


8.5 节 
使 用 下 面 的 控制 流 图 解决 问题 1 和 2: 





1. 使 用 上 面 所 示 的 CFG: 
a. 在 这 一 CFG 中 寻找 扩展 基本 块 。 
b. 寻找 每 一 个 基本 块 的 支配 者 集合 。 
c. 构筑 这 一 CFG 的 支配 树 。 
2. 使 用 上 面 练习 的 CFG: 
a. 将 超 局 部 值 编号 运用 到 这 一 CFG 上 。 
b. 将 基于 支配 者 的 值 编号 运用 于 这 一 CFG 上 。 


8.6 节 
使 用 下 面 的 控制 流 图 解决 问题 1 和 2。 





761 
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1. 与 值 编号 技术 不 同 ， 全 局 元 余 消 除 算法 (GRE) 使 用 可 用 表达 式 发 现 不 同 的 宛 余 集 合 。 
a. 在 前 面 的 CFG 中 ，GRE 把 哪些 表达 式 作 为 元 余 处 理 ? 
b. 基于 支配 者 的 值 编号 找到 哪些 GRE 无 法 找到 的 元 余 表 达 式 。 
2. 计算 上 面 CFG 中 的 各 块 的 DEEXPR、EXRPKILL 和 AVAIL 集 合 。 重 写 这 一 代码 ， 使 用 拷贝 表达 式 取代 
宛 余 表达 式 。 
3. 如 图 8-8 所 示 ，EXPRKILL 的 计算 比 DEEXPR 集 合 的 计算 更 复杂 。 草 拟 算法 
a. 为 表达 式 构 造 名 字 空间 。 
b. 构造 从 VARKILL 到 EXPRKILL 的 映射 。 
评估 你 的 算法 的 浙 近 复杂 度 。 你 可 以 使 它 多 快 ? 
4. 8.6.2 节 给 出 插入 全 局 元 余 消 除 所 需 的 拷贝 操作 的 一 种 方案 。 这 一 方案 插入 一 些 无 用 的 拷贝 操作 (这 些 
操作 将 被 死 代码 消除 器 消除 )。 开 发 另 一 个 生成 更 少 无 用 找 贝 的 插入 拷贝 技术 。 


8.7 节 


1. 本 节 描 述 两 种 代码 复制 的 形式 ， 复 制 和 内 联 替 换 。 
a. 程序 设计 语言 的 什么 属性 阻碍 编译 器 复制 一 个 块 或 内 联 替 换 一 个 被 调用 过 程 ? 
b. 复制 和 内 联 替 换 都 既 有 效益 又 有 负荷 。 给 出 编译 器 可 以 用 于 决定 复制 一 个 块 的 时 机 的 策略 。 给 出 编 
译 器 可 以 用 于 决定 内 联 赫 换 一 个 调用 的 时 机 的 策略 。 
2. 在 某 些 环境 中 ， 代 码 复制 总 是 有 意义 的 。 例 如 ， 只 从 一 个 调用 场所 被 调用 的 过 程 是 内 联 替 换 的 强 候选 ， 
除非 内 联 使 调用 者 太 大 而 无 法 适合 存储 器 层次 的 某 个 层次 。 
a. 在 什么 样 的 环境 下 ， 编 译 器 应 该 总 是 复制 一 个 块 ? 
b. 在 什么 样 的 环境 下 ， 编 译 器 应 该 总 是 内 联 替 换 一 个 调用 ? 
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9.2 节 


1. 图 9-2 中 的 活性 分 析 算 法 初始 化 每 一 个 块 的 LIVEOUT 和 集合 为 6p。 有 其 他 初始 化 的 可 能 吗 ? 它们 改变 分 
析 的 结果 吗 ? 证 明 你 的 答案 。 

2. 图 9-2 中 的 活性 分 析 算法 在 CFG 中 的 所 有 结 点 上 迭代 ， 但 是 它 不 特定 处 理 块 的 顺序 。 这 一 顺序 重要 吗 ? 

3. 在 活 变量 分 析 中 ， 编 译 器 应 该 如 何 处 理 包含 过 程 调用 的 块 ? 这 样 的 块 的 UEVAR 集 合 应 该 包含 什么 ? 
它 的 VARKILL 集 合 应 该 是 什么 ? 

4. 考虑 下 面 的 控制 流 图 : 


a. 为 上 图 中 的 结 点 计算 逆 前 序 编号 。 
b. 为 上 图 中 的 结 点 计算 逆 后 序 编 号 。 
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9.35 
1. 考虑 下 面 的 控制 流 图 : 





a. 计算 CFG I、I 和 II 的 支配 者 树 。 
b. 分别 计算 CFG I 中 结 点 3 和 结 点 5，CFG II 中 的 结 点 4 和 结 点 5， 以 及 CFG IIH 的 结 点 3 和 结 点 11 的 支配 
边界 。 
2. 把 下 面 的 控制 流 图 中 的 代码 转换 成 SSA 形 式 。 给 出 8 函数 插入 和 重 命 名 后 的 最 终 代 码 。 





3. 考虑 所 有 这 样 的 块 的 集合 ， 由 于 某 个 块 5 中 的 赋值 x<-… 它 得 到 某 个 函数。 图 9-11 中 的 算法 在 DF(b) 中 
的 每 一 个 块 内 插入 一 个 函数 。 那 些 块 中 的 每 一 个 都 被 加 入 工作 列表 ; 它们 反 过 来 又 可 以 把 在 它们 的 
DF 集合 内 的 结 点 加 入 这 一 工作 列表 中 。 这 一 算法 使 用 一 个 检查 列表 来 避免 把 一 个 块 多 次 加 入 工作 列 
表 中 。 称 所 有 这 些 块 的 集合 为 DF*(b)。 

我 们 可 以 把 DF*(b) 定义 为 下 面 序列 的 极限 。 
DF) (b) = DF(b) 
DF,(b) = DF (b) U,e DF, œ) DF(z)) 


DF;+1(b) = DF,(b) UzeDF.,() DF,(x)) 765 
使 用 这 些 扩展 集合 DF*(b) 导致 插入 $ 函 数 的 一 个 更 简单 的 算法 。 
a. 开发 一 个 计算 DF1(b) 的 算法 。 
b. 开发 一 个 使 用 DEF- 集合 插入 4 函数 的 算法 。 
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c. 将 你 的 新 算法 的 整体 代价 ， 包 括 计 算 DF'* 和 集合 的 代价 ， 与 9.3.3 节 给 出 的 9 插入 算法 的 代价 做 比较 。 
4.“ 极 大 ”SSA 构 造 法 既 简单 又 直观 。 然 而 ， 它 插入 的 4 函数 的 数量 可 能 比 “ 半 裁剪 ”算法 多 很 多 。 特 

别 是 它 既 插入 宛 余 g 国 数 (xi eg (xj，xj)) 又 插入 结果 从 不 被 使 用 的 死 $ 函 数 。 

a. 给 出 一 个 检查 并 消除 极 大 构造 插入 的 额外 9 函数 的 方法 。 

b. 你 的 方法 能 够 把 8 函数 集合 降低 到 半 裁 前 构造 法 所 插入 的 那些 9 函数 吗 ? 

c. 将 你 的 方法 的 渐 近 复杂 度 与 半 裁 剪 构造 法 的 渐 近 复杂 度 做 对 比 。 


9.4 节 
1. 对 于 下 面 各 控制 流 图 ， 说 明 它 是 否 是 可 归 约 的 。 
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2. 证 明 可 归 约 图 的 如 下 定义 与 使 用 转换 石和 九 的 定义 等 价 : “一 个 图 G 是 可 归 约 的 ， 当 且 仅 当 消 除 它 的 后 
边 产生 一 个 无 环 图 G'。” (回想 一 下 ， 后 边 是 目标 支配 源头 的 边 。) 
3. 使 用 7T, 和 7 给 出 一 个 简化 图 9-21 中 标签 为 “After” 的 图 的 简化 序列 。 
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10.3 节 


一 


-优化 器 的 主要 功能 之 一 是 消除 编译 器 在 把 源 语言 转化 成 人 R 时 所 带 来 的 负荷。 
a. 给 出 4 个 你 希望 编译 器 可 以 改进 的 低 效率 例子 ， 并 给 出 引发 这 些 例子 的 源 语言 构造 。 
b. 给 出 4 个 你 预期 编译 器 错过 的 低 效 率 例子 ， 即 使 它们 能 够 被 改进 。 解 释 为 什么 优化 器 改进 它们 有 
困难 。 
. 编译 器 可 以 用 很 多 方法 找到 并 消除 元 余 计 算 。 其 中 包括 值 编号 、 基 于 可 用 表达 式 的 全 局 公共 子 表达 式 
(GCSE) 消除 和 情 性 代码 移动 (LCM). 
a. 给 出 两 个 由 值 编号 消除 的 而 GCSE 或 LCM 却 无 法 找到 的 元 余 例子 。 
b. 给 出 LCM 发 现 而 值 编号 和 GCSE 却 无 法 发 现 的 例子 。 
c. GCSE 可 以 发 现 LCM 无 法 发 现 的 元 余 吗 ? 给 出 一 个 例子 ， 或 证 明 你 的 答案 。 
:图 10-3 给 出 计算 DEAD 的 算法 。 其 标记 遍 是 一 个 经 典 的 不 动 点 计算 。 
a. 解释 为 什么 这 一 计算 终止。 
b. 这 一 算法 找到 的 不 动 点 是 惟一 的 吗 ? 证 明 你 的 答案 。 
c. 得 出 这 一 算法 的 严格 时 间 边 界 。 
. 考虑 10.3.1 节 的 算法 CLEAN。 它 消除 无 用 控制 流 并 简化 CFG。 
a. 为 什么 这 一 算法 终止 ? 
b. 给 出 这 一 算法 的 总 体 时 间 界 限 。 
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5. 对 于 一 个 表达 式 的 多 重 评估 ， 提 升 使 用 放置 到 CFG 中 它们 “之 上 ”的 单一 评估 取代 它们 。 一 个 称 为 下 
沉 (sinking) 的 类 似 转换 可 以 在 代码 中 寻找 这 样 的 地 点 : (1) 每 一 个 到 达 块 2 的 路 径 包 含 一 个 e 的 评 
估 ; (2) 在 b 评 估 e 产 生 相 同 结果 ; (3) e 的 结果 在 2 之 前 不 被 使 用 。 

a. 形式 化 定位 下 沉 机 会 所 需 的 数据 流 问 题 并 证 明 它 的 安全 性 。 
b. 概述 一 个 (对 于 下 沉 ) 插入 新 评估 并 消除 早 前 评估 的 高 效 算法 。 


10.4 节 


1. 操作 符 强度 减弱 的 一 个 简单 形式 使 用 一 系列 执行 代价 较 小 的 操作 取代 一 个 代价 高 的 操作 。 例 如 ， 可 以 {768 
用 移 位 和 加 法 序列 取代 某 些 整数 乘法 操作 。 
a. 必须 满足 什么 样 的 条 件 才 能 使 编译 器 安全 地 用 单一 移 位 操作 取代 整数 操作 x<-y x z。 
b. 概述 一 个 算法 ， 对 于 已 知 常量 和 无 符号 整数 的 乘积 且 该 常量 不 为 2 的 午 的 情况 ， 它 使 用 移 位 和 加 法 
的 序列 取代 该 乘法 。 
2. 编译 器 可 以 使 用 过 程 抽 象 来 缩小 它 生 成 的 代码 尺寸 。 
a. 为 了 编译 器 可 以 安全 地 运用 过 程 抽象 ， 重 复 代 码 序列 必须 满足 什么 样 的 条 件 ? 
b. 你 的 编译 器 找到 了 两 个 有 相同 操作 和 寄存 器 名 字 的 代码 序列 。 然 而 ， 这 一 序列 在 中 间 有 一 个 分 支 ， 
而 且 两 个 实例 分 支 到 不 同 的 目标 。 编 译 器 将 如 何 处理 这 样 的 情况 ? 你 能 一 般 化 你 的 想法 吗 ? 
c. 过 程 抽象 的 负荷 是 什么 ? 存在 负荷 超过 转换 效益 的 情况 吗 ? 


第 11 章 


11.2 节 


1. 图 7-2 所 示 的 树 遍 历代 码 生成 器 对 每 一 个 数 使 用 一 个 1oadI。 重 写 树 遍历 代码 生成 器 ,使 得 它 使 用 addI、 
subI、rsub、multI、divI 和 rdivI。 解 释 你 的 代码 生成 器 所 需 的 任意 额外 例 程 或 数据 结构 。 


11.3 节 


1. 使 用 图 11-5 给 出 的 规则 ， 生 成 两 个 图 11-4 所 示 AST 的 覆盖 。 769 
2. 以 图 11-4 中 的 树 为 模型 ， 构 建 下 面 表达 式 的 低级 抽象 语法 树 。 
ayeaxbt+exd 
bowexxyxz-7 
ERE-S CH YO ey a BB IE: LILO. 
3. BY ARK DC ACARI ED A ER 
a. 怎样 扩展 这 些 想法 来 处 理 结 点 可 以 有 多 个 父亲 DAG 呢 ? 
b. 控制 流 是 怎样 适合 这 一 范例 的 ? 
4. 在 任意 树 遍历 代码 生成 方案 中 ， 编 译 器 都 必须 选择 子 树 的 评估 顺序 。 即 ESE CO Men, BE 
评估 左 子 树 还 是 右 子 树 ? 
a. 顺序 的 选择 会 影响 评估 整个 子 树 所 需 的 寄存 器 数量 吗 ? 
b. 这 一 选择 如 何 能 够 并 入 自 底 向 上 树 模 式 匹 配方 案 中 ? 


11.4 节 


1. 真实 的 窥 孔 优化 器 必须 处 理 控制 流 操作 ， 包 括 条 件 分 支 、 跳 转 和 标号 语句 。 
a. 当 闪 孔 优化 器 把 一 个 条 件 分 支 带 人 优化 窗口 时 ， 它 应 该 做 什么 ? 





-A 
~ 
© 


-A 


448 4 F 


b. 当 它 遇 到 一 个 跳 转 时 ， 情 况 有 什么 不 同 ? 

c. 对 于 标号 语句 情况 又 如 何 ? 

d. 为 了 改进 这 一 状态 优化 器 能 够 做 什么 ? 
2. 写 出 罕 孔 转换 器 执行 简化 和 匹配 功能 的 具体 算法 。 

a. 你 的 每 一 个 算法 的 渐 近 复杂 度 是 什么 ? 

b. 转换 器 的 运行 时 间 是 如 何 受 到 较 长 输入 程序 、( 为 了 简化 和 匹配 的 目的 ) 更 大 的 窗口 和 更 大 的 模式 

集合 的 影响 的 ? 

3. 当 罕 孔 转换 器 在 选择 代码 的 具体 实现 时 简化 代码 。 假设 罕 孔 转换 器 在 指令 调度 和 寄存 器 分 配 之 前 运行 ， 

且 假 设 这 一 转换 器 可 以 使 用 足够 多 的 虚拟 寄存 器 名 字 。 

a. 这 一 罕 孔 转换 器 可 以 改变 对 寄存 器 的 需求 吗 ? 

b. 这 一 帘 孔 转 换 器 能 够 改变 适合 于 调度 器 重 排序 代码 的 机 会 吗 ? 
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12.2 节 


1. 开发 一 个 为 基本 块 构筑 优先 图 的 算法 。 假 设 这 一 块 是 用 ILOC 写 成 的 ， 且 在 这 一 块 外 部 定义 的 任意 值 
在 这 个 块 开始 执行 之 前 已 准备 就 绪 。 

2. 如 果 优 先 图 的 主要 用 途 是 指令 调度 ， 那 么 目标 机 器 上 实际 等 待 的 精确 模型 化 是 至 关 重要 的 。 
a. 优先 图 应 该 如 何 模 型 化 由 歧义 内 存 引 用 所 引发 的 非 确 定性 ? i 
b. 在 某 些 管道 化 处 理 器 中 ， 读 后 写 人 的 等 待 可 能 比 写 后 读 出 的 等 待 短 。 例 如 ， 下 面 的 序列 


[ add rigsriz = rz | sub riasrn = ro] 


将 在 把 sub 的 结果 写 人 ro 之前， 为 了 在 add 中 的 使 用 先 读 取 rio 的 值 。 对 于 这 样 的 体系 结构 ， 编 译 器 如 
何 表示 优先 图 中 的 反 依 赖 性 呢 ? 

c. 某 些 处 理 器 绕 开 内 存 以 降低 写 后 读 出 延迟 。 对 于 这 样 的 机 制 ， 诸 如 下 面 的 序列 

storeAl ro; => Larp 16 


loadAl rarp,16 > riz 


将 〈 在 这 一 序列 开始 处 的 ra 中 ) 存储 的 值 直接 向 前 传 给 装 和 人 结果 (riz)。 依 赖 图 如 何 反映 这 种 硬件 上 
的 绕 过 特性 ? 


12.3 节 


1. 扩展 如 图 12-3 所 示 的 局 部 列表 调度 算法 来 处 理 多 功能 单元 。 假 设 所 有 功能 单元 有 相同 的 容量 。 
2. 所 有 调度 算法 的 关键 方面 是 设置 初始 优先 度 和 当 车 干 带 有 相同 优先 度 的 操作 在 同一 周期 准备 就 绪 时 进 
行 平局 加 赛 。 文 献 中 所 给 出 的 某 些 平局 加 赛 包括 : 
a. 取 优 先 图 中 带 最 多 后 代 的 操作 。 
b. 取 最 长 等 待 时 间 的 操作 。 
c. 取 执行 后 活着 的 操作 数 最 少 的 操作 。 
d. 取 随 机 选取 的 操作 。 
e. 取 任意 计算 之 前 的 一 个 装 入 。 
对 于 每 一 种 平局 加 赛 ， 给 出 一 个 理由 : 也 就 是 对 某 人 为 什么 要 提议 这 一 平局 加 赛 给 出 猜测 。 你 首 
选 的 平局 加 赛 是 哪 一 个 ”其 次 又 是 哪 一 个 ? 证明 (或 解释 ) 你 的 答案 。 





4 J 449 


3. KB BBR ADE 88 ABLES TP RT AD REER FAA (delay slot)。 使 用 单一 等 待 槽 ， 紧 跟 在 这 
一 分 支 后 面 的 操作 在 分 支 处 理 的 同时 执行 ; 因此 ， 调 度 一 个 分 支 的 理想 槽 是 在 基本 块 的 倒数 第 二 个 周 
” 期 。( 大 多 数 处 理 器 有 不 执行 等 待 槽 的 分 支 版 本 ， 因 此 编译 器 可 以 避免 在 未 填充 等 待 模 生 成 nop 指 令 .) 72 
a. 你 将 如 何 改编 列表 调度 算法 以 改进 它 “ 填 充 ” 等 待 槽 的 能 力 。 
b. 概述 一 个 填充 等 待 槽 的 后 调度 遍 。 
c. 提出 不 被 有 用 操作 填充 的 分 支 等 待 槽 的 建设 性 使 用 。 


12.4 节 


1. 操作 出 现 的 顺序 决定 值 创建 的 时 间 和 它们 最 后 一 次 使 用 的 时 间 。 这 些 综合 效应 决定 值 的 寿命 。 
a. 调度 器 如 何 减 小 对 寄存 器 的 需求 ? 给 出 适合 列表 调度 器 的 一 个 具体 的 平局 加 赛 。 
b. 面向 寄存 器 平局 加 赛 和 产生 短 调度 的 调度 器 能 力 之 间 的 相互 作用 是 什么 ? 
2. 软件 管道 交 迭 循环 迭代 以 产生 与 硬件 管道 相似 的 效应 。 
a. 你 希望 软件 管道 对 寄存 器 的 需求 有 什么 影响 ? 
b. 调度 器 如 何 使 用 预测 执行 来 减 小 软件 管道 对 代码 空间 的 不 利 影响 。 
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13.3 节 

1. 考虑 下 面 的 ILOC 基 本 块 。 假 设 rsp 和 ri 在 这 个 块 的 入 口 都 是 活 的 。 773 
loadAl rarp,12 > ra 
loadAl rarp,16 = mb 
add risra > re 
sub rosri => Ta 
mult resrd => re 
mltl ry,2 >r 
add rert > My 
storeAl ry => rarps8 
jmp 一 Loos 


a. 给 出 在 这 个 块 上 使 用 自 顶 向 下 局 部 算法 分 配 寄存 器 的 结果 。 假 设 目标 机 器 带 有 4 个 寄存 器 。 

b. 给 出 在 这 个 块 上 使 用 自 底 向 上 局 部 算法 分 配 寄存 器 的 结果 。 假 设 目标 机 器 带 有 4 个 寄存 器 。 

. 自 顶 向 下 局 部 分 配器 在 对 值 的 处 理 方面 是 相当 朴素 的 。 它 把 一 个 值 在 整个 基本 块 分 配 到 寄存 器 上 。 

a. 一 个 改进 的 版 本 可 能 是 计算 在 这 个 块 内 的 活性 区 域 ， 并 在 值 的 活性 区 域内 为 值 分 配 寄存 器 。 为 完成 
这 一 任务 要 做 什么 必要 的 修改 ? 

b. 进一步 的 改进 可 能 是 ， 当 一 个 值 在 其 活性 区 域 无 法 容纳 于 单一 寄存 器 时 ， 分 割 这 一 活性 区 域 。 给 出 
(1) 在 寄存 器 不 可 用 时 分 割 指令 (或 指令 区 域 ) 附近 的 活性 区 域 ; 并 (2) 对 这 一 活性 区 域 的 余下 
各 个 部 分 重新 分 配 ; 所 需 的 数据 结构 和 算法 修正 。 

c. 使 用 这 些 修正 ， 频 率 计 数 技术 应 该 生成 更 好 的 分 配 。 预 期 你 的 结果 与 使 用 自 底 向 上 局 部 算法 比较 时 
结果 如 何 ?证 明 你 的 答案 。 


N 


13.445 
1. 考虑 如 下 的 控制 流 图 : . [774] 
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假设 read 返 回 一 个 外 部 媒介 的 值 而 write 把 一 个 值 传送 给 外 部 媒介 。 

a. 计算 每 一 个 块 的 LIVEIN 和 LIVEOUT 集 合 。 

b. 将 自 底 向 上 算法 运用 于 每 一 个 块 4、B 和 C。 假 设 有 三 个 寄存 器 可 以 用 于 计算 。 如 果 块 8 定义 一 个 名 
字 n 且 nELIVEOUT(b)， 那 么 分 配器 必须 把 x 存储 回 内 存 中 ， 使 得 它 的 值 在 后 继 块 可 用 。 同 样 地 ， 如 
果 块 b 在 名 字 n 的 所 有 局 部 定义 之 前 使 用 n， 那 么 它 必须 从 内 存 装 入 nn 的 值 。 给 出 其 结果 代码 ， 包 括 所 
有 的 装 入 和 存储 。 

c. 给 出 允许 LIVEOUT(4) 中 的 某 些 值 保 留 在 寄存 器 中 以 避免 后 继 块 中 的 初始 装 入 的 方案 。 


13.5 节 
1. 考虑 下 面 的 冲突 图 : 


N 
~d 
n 


假设 目标 机 器 刚好 有 三 个 寄存 器 。 
a. 把 自 底 向 上 全 局 着 色 算 法 运用 于 此 图 。 哪 些 虚 拟 寄存 器 将 被 溢出 ? 哪些 虚拟 寄存 器 被 着 色 ? 
b. 溢出 结 点 的 选择 有 区 别 吗 ? 
c. 星 前 的 着 色 分 配器 溢出 选择 时 受到 限制 的 所 有 活性 区 域 。 它 们 不 是 使 用 如 图 13-8 所 示 的 算法 ， 而 是 
使 用 如 下 的 方法 : 
initialize stack to empty 
while (N= ¢) 
fine Nwith n° < k then 
remove n and its edges from I 
push n onto stack 
else 
pick a node n from N 
mark n to be spilled 
如 果 这 一 方法 标 出 任意 溢出 的 结 上 点， 那么 分 配器 插入 溢出 代码 ， 并 在 修改 后 的 程序 上 重复 这 一 分 
配 过 程 。 如 果 没 有 溢出 结 点 ， 它 继续 用 自 底 向 上 全 局 分 配器 所 描述 的 方法 进行 着 色 。 
当 这 一 算法 被 用 于 示例 神 突 图 时 将 发 生 什 么 ? 用 于 选择 溢出 结 点 的 机 制 改变 结果 吗 ? 
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2. 寄存 器 分 配 之 后 ， 仔 细 的 代码 分 析 可 能 会 发 现 ， 在 代码 的 某 些 伸 长 部 分 存在 未 使 用 的 寄存 器 。 在 自 底 
向 上 图 着 色 全 局 分 配器 中 ， 因 为 活性 区 域 的 溢出 方法 中 细节 上 的 缺点 ， 这 种 情况 将 会 出 现 。 
a. 解释 这 一 情况 是 如 何 出 现 的 ? 
b. 编译 器 如 何 发 现 这 一 情况 的 发 生 及 发 生 的 地 点 ? 
c. 我 们 可 以 使 用 这 些 未 使 用 的 全 局 框架 内 部 和 外 部 的 寄存 器 做 些 什么 ? 


13.6 节 


1. 当 图 着 色 全 局 分 配器 达到 没有 适合 特定 活性 区 域 的 颜色 的 地 点 LR 时 ， 它 溢出 或 分 割 这 一 个 活性 区 域 。 
另外 ， 它 也 许 设法 对 LR; 的 一 个 或 多 个 邻居 重新 着 色 。 考 虑 <LR:，LRi>E7 且 <LR,，LRe>E1， 但 是 <LR/， 
LR.> 儿 1 的 情况 。 如 果 LRj 和 LR 已 被 着 色 ， 且 得 到 了 不 同 的 颜色 ， 那 么 分 配器 可 以 把 其 中 一 个 重新 着 
色 为 另 一 个 活性 区 域 的 颜色 ， 为 LR 释放 一 个 颜色 。 

a. 概述 一 个 发 现 是 否 存 在 LR; 的 合法 且 实 用 的 重新 着 色 的 算法 。 
b. 你 的 技术 对 寄存 器 分 配器 的 浙 近 复杂 度 的 影响 是 什么 ? 
c. 你 应 该 考虑 对 LR 的 邻居 进行 递归 重新 着 色 吗 ? 解释 你 的 理由 。 

2. 自 底 向 上 全 局 分 配器 的 描述 提出 : 为 被 分 割 活性 区 域 的 每 一 个 定义 和 使 用 插入 洲 出 代码 。 自 顶 向 下 全 
局 分 配器 首先 把 这 一 活性 区 域 分 割 成 以 块 为 单位 的 片 ， 然 后 ， 当 结果 不 受 限制 时 把 这 些 片 组 合 起 来 ， 
最 后 给 它们 指定 颜色 。 

a. 如 果 给 定 块 有 一 个 或 多 个 自由 寄存 器 ， 多 次 溢出 一 个 活性 区 域 会 造成 浪费 。 对 自 底 向 上 全 局 分 配器 
的 溢出 方案 提出 一 个 避免 这 一 问题 的 改进 。 

b. 如 果 给 定 块 有 太 多 的 交 选 活性 区 域 ， 那 么 分 割 已 溢出 活性 区 域 对 处 理 这 个 块 中 的 问题 毫 无 帮助 。 提 
出 一 个 (不 同 于 局 部 分 配 的 ) 机 制 来 改进 在 块 中 对 寄存 器 要 求 较 高 的 模块 内 自 顶 向 下 全 局 分 配器 的 
行为 。 
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索引 中 的 页 码 为 英文 原 书 页 码 ， 与 书 中 边栏 页 码 一 致 。 


¢@functions (4 函数 )，229-231，636 
arguments ( ¢ aH), 231, 455 
behavior ( pH RITA), 229 
block execution ( @HmBRATT), 478 
concurrent execution (PARIH EIT), 464 
dead (PHRF) 466 
defined (函数 定义 )，228 
as definitions (9 函数 作为 定义 ) 456 
duplicate (9 函数 复制 )，avoiding (回避 9 函数 复制 )， 
464 
evaluation rules ( 9 函数 评估 规则 )，479 
example (9 函数 例子 )，465-466，468 
. execution (bg 函数 执行 )，230 
extraneous (% A pm), 457 
implementation and (9 函数 实现 和 )，474 
insertion (% 国 数 插入 )，228，229，230，456，464 
insertion algorithm (4 国 数 插 人 算法 ) 464 
placing (4% 国 数 放 置 ) 463-466 
targets (9 函数 目标 )，472，479 
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abstract syntax trees (抽象 语法 树 ) (AST), 139 

building (抽象 语法 树 构 建 )，196-197 

defined (抽象 语法 树 定 义 ) 214 

exposing detail in (在 抽象 语法 树 中 揭示 更 多 细节 )， 
556 l 

illustrated (阐明 抽象 语法 树 )，214 

low-level (低级 抽象 语法 树 )，218,，556，559 

mapping, to operations (抽象 语法 树 到 操作 的 映射 )， 
559 

node type (抽象 语法 树 结 点 类 型 )，557 

nodes (抽象 语法 树 结 点 )，216，394 

size reduction (抽象 语法 树 大 小 的 减 小 )，216 

source-level ( 源 代码 级 抽象 语法 树 )，211，217， 
218 

as source-level representation (作为 源 代码 级 表示 的 
抽象 语法 树 )，215 


structure (抽象 语法 树 的 结构 )，187 
tiling (FARBER), 559, 564 
uses 《抽象 语法 树 的 使 用 ) 215 


See also syntax-related trees 


abstraction (抽象 ) 


concept (抽象 的 概念 ) 275 

control (抽象 控制 )，252，254-256 

grammar nonterminals and (抽象 文法 非 终 结 符 和 )， 
560 

level of (HRY), 217-218, 548 

overhead, reducing (降低 抽象 负荷 ) 392 

procedure (抽象 过 程 )，539 

transition diagrams and (抽象 转换 图 和 )，31 


accept action 【接受 动作 ) 117 
access links ( 存 取 链 接 ) 282-283 


defined〈 存 取 链 接 定义 ) 282 

global display vs. ( 存 取 链接 全 局 显示 与 )，285 
maintaining ( 存 取 链接 维护 )，283，285 
managing ( 存 取 链 接管 理 )，290 

null ( 存 取 链接 是 空 的 )，283 

overhead ( 存 取 链 接 负荷 )，285 

references through ( 存 取 链接 通过 … 引 用 )，285 
use illustration ( 存 取 链 接 使 用 说 明 )，282 


Action table (动作 表格 )，116，117，118 


directly encoding (动作 表格 直接 编码 )，145-147 
“don’t care” states (动作 表格 “ 非 关 心 ” 状 态 )，146 
filling in (填充 动作 表格 )，127-129 

non-error entries (动作 表格 的 非 错 误 条 目 )，128 
terminal symbols (动作 表格 中 的 终结 符号 )，144 

See also LR(1) tables 


actions (动作 ) 


accept (接受 动作 )，117 

in accepting states (接受 状态 中 的 动作 )，65 

ad hoc (特定 动作 )，115 

communicating between (动作 之 间 的 交流 )，190-191 
coordinating series of (协调 一 系列 动作 )，201 

error 《错误 动作 )，117 
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placement of (动作 放置 ) 67 
reduce (动作 简化 )，117 
scanner generator and (扫描 器 生成 器 和 )，66 
shift ( 移 位 动作 )，117 
specifying (描述 动作 ) 65-67 
syntax-directed (语法 制导 动作 )，190 
table-filling (表格 填充 动作 )，128 
activation (活动 )，254 
activation record pointers(ARPs) (活动 记录 指针 )，17， 
262-264 
callee (被 调用 者 活动 记录 指针 )，263，276，289 
caller (调用 者 活动 记录 指针 )，263，283 
defined (活动 记录 指针 定义 )，262 
as starting point (作为 开始 点 的 活动 记录 指针 )，263 
activation records(ARs) (活动 记录 )，262-267 
allocating (活动 记录 分 配 ) 265-267, 288-289 
coalescing ( 活动 记录 接合 )，267 
combining (活动 记录 合并 )，267 
defined (活动 记录 定义 )，262 
heap allocation of (活动 记录 的 堆 分 配 ) 266-267, 
288-289 
illustrated (插图 说 明 的 活动 记录 )，263 
local storage (局 部 存储 的 活动 记录 )，263-265 
stack allocation of (活动 记录 的 栈 分 配 )，265-266， 
288 
static allocation of (活动 记录 的 静态 分 配 )， 267 
See also name spaces 
ad hoc syntax-directed translation (专用 语法 制导 翻译 )， 
188-202 
ASTs building (AST 构 建 的 专用 语法 制导 翻译 )， 
196-197 
communication between actions (动作 间 交 流 的 专用 
语法 制导 翻译 ) 190-191 
declaration processing (声明 过 程 的 专用 语法 制导 翻 
译 )，198-202 
defined (专用 语法 制导 翻译 的 定义 )，188 
examples (专用 语法 制导 翻译 的 例子 )，193-202 
ILOC generation (ILOC 生 成 的 专用 语法 制导 翻译 )， 
197-198 
implementing (实现 专用 语法 制导 翻译 )，190-193 
for inferring expression types (推断 表达 式 类 型 的 专 
用 语法 制导 翻译 )，195 
load tracking with ( 带 有 专用 语法 制导 翻译 的 装 入 跟 
踪 )，193-195 
naming values (命名 值 的 专用 语法 制导 翻译 )，191-192 
for signed binary numbers ( 带 符号 二 进 制 数 的 专用 语 
法 制导 翻译 ) 189 
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snippets (专用 语法 制导 翻译 方案 中 的 代码 片段 )，189 
addI operation (专用 语法 制导 翻译 中 的 addI 操 作 )， 
529 
address space (地 址 空间 ) 
layout (地 址 空间 布局 ) 291 
logical ( 逻辑 地 址 空间 ) 291 
utilization (利用 地 址 空间 ) 291 
views (地 址 空间 的 观点 )，292 
addressability (可 寻 址 性 )，280-285 
addresses (地 址 ) 
calculation cost (地址 计算 的 代价 )，283 
calculation form (地 址 计算 的 形式 )，391-392 
directly computing (直接 计算 地 址 )，367 
logical, mapping (地 址 逻辑 ， 映 射 )，291-292 
receiver (接受 者 地 址 )，370 
run-time (运行 时 地 址 )，281 
trivial base ( 平 几 基础 地 址 )，280-281 
address-immediate operations (地 址 立即 操作 )，664 
address-offset operations (地 址 偏 移 操 作 )，664 
Algol-like languages (Algol 类 语言 ) 
name spaces in (Algol 类 语言 中 的 名 字 空 间 )，257- 
259 
object-oriented languages vs. (面向 对 象 语言 和 Algol 
语言 )，274-275 
alias pairs (别名 对 )，486 
alignment rules ( 对齐 规 则 )，293 
allocate routine (分 配 例 程 )，296，297，298-299 
allocation. See register allocation 
allocators (分 配器 ) 
arena-based (基于 区 域 分 配器 )，298 
bottom-up local register ( 自 底 向 上 局 部 寄存 器 分 配 
器 )，626-629 
first-fit (首次 拟 合 分 配器 )，296-298 
garbage-collecting (垃圾 回收 分 配器 )，298 
global (全 局 分 配器 )，641 
multipool (多 池 分 配器 ) 298-299 
register (寄存 器 分 配器 )，316，620，626-629，650-651 
alternation (选择 ) 
regular expressions (选择 正则 表达 式 )，37 
transformations, applying (选择 转换 ， 运 用 ) ，48-49 
ambiguity (歧义 性 ) 
context-sensitive (上 下 文敏 感 的 歧义 性 )，136-138 
grammar (歧义 性 文法 )，132 
if-then-else (歧义 的 1f-then~else),，81-82，121 
removal (歧义 性 消除 )，82 
ambiguous branches (tX HERJA Æ), 505 
ambiguous grammars (歧义 性 的 文法 )，81 
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ambiguity removal (歧义 性 文法 的 歧义 性 消除 ) 82 
example ( 坡 义 性 文法 例子 ) 81-82 
if-then-else (歧义 性 文法 的 if-then-e1se)，82， 
83 
reduce-reduce conflict (歧义 性 文法 归 约 冲突 )，133 
table-filling algorithm and (表格 填充 和 歧义 性 文法 )， 
132 
ambiguous memory references (歧义 性 内 存 引 用 )，486 
ambiguous pointers (歧义 性 指针 )，396 
ambiguous values (歧义 性 值 )，312，656-657 
analysis ( 野 义 性 值 分 析 )，312 
heavy use code (歧义 性 值 频繁 使 用 代码 )，656 
in memory (内 存 中 的 歧义 性 值 ) 312 
analysis (分 析 )，15-16 
context-sensitive ( 上 下 文敏 感 分 析 )，12，28 
control-flow (控制 流 分 析 )，484 
data-flow (数据 流 分 析 )，1$，417，433-490 
dependence (相关 分 析 )，15-16 
dynamic (动态 分 析 )，436 
interprocedural (过 程 内 分 析 )，362，434，483-488 
in larger scopes 〈 较 大 作用 域内 分 析 )，424 
local (局 部 分 析 ) ，434 
pointer (指针 分 析 ) 396, 449, 486 
recompilation ( 重 编译 分 析 )，487-488 
semantic (语义 的 分 析 )，12 
static (静态 的 分 析 )，433，434，436 
very busy (非常 忙碌 分 析 )，451-452 
anonymous values (匿名 值 )，350 
loading ( 装 入 匿名 值 )，351-352 
storing (存储 匿名 值 )，351-352 
anticipability ( 可 前 置 性 )，506 
anticipable expressions (可 前 年 表达 式 ) 509-514 
earliest placement (可 前 置 表达 式 最 早 放 置 ) 506, 
510-511 
later placement (可 前 置 表达 式 的 后 放置 ) 506, 
511-512 
antidependencies ( 反 相 关 性 ) 
avoiding (避免 反 相关 性 )，595 
breaking (破坏 反 相关 性 )，604 
constraints ( 反 相 关 性 的 限制 )，592 
defined ( 反 相 关 性 定义 )，591 
introduction of 〈《 反 相关 性 的 引入 ), 594 
respecting 《反映 反 相关 性 ) 592 
arena-based allocation (基于 实 块 分 配 )，298 
arithmetic operations (算术 操作 ) 662-663 
arithmetic operators ( ARRET), 9, 313-322 


assignment (算术 操作 符 赋值 )，321 
associativity (算术 操作 符 的 可 结合 性 )，321-322 
commutativity (算术 操作 符 的 可 交换 性 )，321-322 
number systems (算术 操作 符 的 数 制 )，321-322 
array elements ( 数组 元 素 ) 
accessing ( 存 取 数 组 元 素 )，338 
referencing (引用 数组 元 素 ) 337-343 
storage location (数组 元 素 的 存储 位 置 )，337 
arrays (%4), 162-163 
address calculations for (数组 的 地 址 计算 )，337， 
340, 390 
address polynomials (数组 的 寻 址 多 项 式 )，340 
bounds (数组 边界 ) 335, 339 
column-major order(〈 列 优先 顺序 使 用 数组 ) 335, 
336 
as constructed type (作为 结构 类 型 的 数组 ) 162 
defined (数组 定义 )，162 
FORTRAN-style (FORTRAN 风 格 )，684-685 
indirection vectors (间接 向 量 )，335，336-337 
operations on , support for (支持 数组 上 的 操作 )， 
162 
passing, as parameters (作为 参数 传输 的 数组 )，341 
passing, by reference (以 引用 传输 的 数组 )，278- 
279 
row-major order ( 行 优先 顺序 使 用 数组 )，335，336 
size determination (数组 大 小 确定 )，341 
storage layout (数组 存储 布局 )，335-337 
string type vs. ( 串 类 型 和 数组 )，163 
of structures (数组 结构 )，353-354 
subscripts (数组 下 标 )，352 
two-dimensional, address computation (二 维 数组 地 
址 计算 )，340 
See also vectors 
array-valued parameters (数组 值 参 数 ) 
accessing ( 存 取 数组 值 人 参数)，341-343 
range checks for (数组 值 参数 的 范围 ) 343 
assignment (赋值 ) 
allocation vs. (分 配 与 赋值 ) 622-623 
boolean (布尔 赋值 )，332 
inside expressions 〈 表 达 式 内 部 的 赋值 ) 85 
integer (整数 赋值 )，168 
Ivalue 〈 左 值 赋值 )，321 
as operator 〈 作为 操作 符 赋值 )，321 
pointer (指针 赋值 )，396-398 
register (寄存 器 赋值 )，594，622-623 
rvalue( 右 值 赋值 )，321 
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string ( 串 赋值 ) 345-349 
associativity (结合 性 ) 139-140, 321-322 
changing 〈 更 改 结合 性 ) 204-206 
left ( 左 结合 性 )，139，140 
operators (操作 符 的 结合 性 ) 321-322 
recursion vsS.〈 左 递归 与 结合 性 ) 205 
for reordering expressions ( 重 排序 表达 式 的 结合 性 )， 
397 
reversing (保持 结合 性 )，206 
right ( 右 结合 性 )，139，140 
attribute grammars (属性 文法 )，171-188 
advocates (属性 文法 的 倡导 者 )，188 
building (构建 属性 文法 )，172 
circular (循环 属性 文法 )，174，176-177 
contents 〈 属性 文法 的 内 容 )，171 
creating/using ( 创建 或 使 用 属性 文法 ) 175 
defined (定义 属性 文法 )，171 
directing flow of (指引 属性 文法 流 )，206 
dynamic methods (关于 属性 文法 的 动态 方法 )，175 
evaluation methods (属性 文法 的 评估 方法 )，175-176 
for execution-time estimator (执行 时 间 评 估 器 的 属性 
文法 )，179-180 
extended examples (属性 文法 的 扩展 例子 )，177-185 
framework (属性 文法 的 框架 )，1 广 -188 
handling nonlocal information (处 理 非 局 部 信息 的 属 
性 文法 )，185-186 
to infer expression types (推断 表达 式 类 型 的 属性 文 
法 )，177-179 
instantiating parse tree (属性 文法 实例 化 分 析 树 ) ， 
186-187 
oblivious methods (属性 文法 的 遗忘 方法 )，176 
paradigm simplicity (属性 文法 范式 的 简洁 性 )，188 
problems with (属性 文法 的 问题 )，185-188 
rule-based evaluators (基于 规则 的 评估 器 的 属性 文 
法 )，188 
rule-based methods (基于 规则 的 方法 的 属性 文法 )， 
176 
S-attributed (S- 属 性 文法 )，178，195 
storage management (属性 文法 的 存储 管理 )，186 
strongly noncircular ( 强 非 循环 属性 文法 )，177 
See also context-sensitive analysis 
attributed parse trees ( 属性 分 析 树 ) 
analysis results ( 属性 分 析 树 的 分 析 结 果 )，187 
evaluating〈 评 估 属 性 分 析 树 )，172 
for signed binary number ( 带 符号 二 进 制 数 的 属性 分 
析 树 )，174 


See also parse trees 
attribute-dependence graph (属性 相关 图 )，172，175 
cyclic (循环 属性 相关 图 )，176 
formation (属性 相关 图 的 格式 )，172 
attributes (属性 ) 
association with nodes (与 结 点 相关 的 属性 )，191 
. central repository for (属性 中 心 存储 室 )，187 
for each grammar symbol (每 种 文法 符号 的 属性 )， 
175 
evaluating (评估 属性 )，174 
”inherited (继承 属性 )，173 
large number of (大 量 属性 )，186 
of node parent, siblings, children ( 父 ， 兄 和 孩子 结 
点 的 属性 )，182 
synthesized (合成 属性 )，173 
attribution rules (属性 规则 )，175，179，185 
AVAIL (AVAIL) 
defined (定义 AVAIL), 419 
LiveOUT vs. (LiveOUTSAVAIL), 438-439 
sets, computing (计算 AVAIL 集 合 )，419-420 
available expressions ( 可 用 表达 式 )，404 
code speed and (代码 速度 和 可 用 表达 式 )，418 
computing (计算 可 用 表达 式 )，419-421，508-509 
defined (定义 可 用 表达 式 )，417-418 
as forward data-flow problem (作为 前 向 数据 流 问题 
的 可 用 表达 式 )，450 
as global data-flow analysis problem (作为 全 局 数据 
流 分 析 问 题 的 可 用 表达 式 )，421 
iterative algorithm for (可 用 表达 式 的 迭代 算法 )， 
421 


back end (后 端 ) 
defined (定义 后 端 ), 5 
generator (后 端 生成 器 )，551 
processes (处 理 后 端 )，549 
retargetable (可 重新 设置 目标 的 后 端 )，550 
See also compilers; front end 
backtracking ( PI), 92 
additional, triggering (引发 多 余 的 回溯 )，93 
eliminating need for ( 消除 对 回溯 的 需求 )，97-101 
Backus-Naur form (Backus-Naur 格 式 )，74-75 
backward list scheduling (向 后 列表 调度 ) 600-603 
defined (定义 向 后 列表 调度 ) 601 
forward list scheduling vs. (前 向 列表 调度 与 向 后 列表 
调度 )，601 
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operation order and (向 后 列表 调度 顺序 和 )，601 
Priority (向 后 列表 调度 的 优先 级 )，602 
schedules (调度 向 后 列表 调度 )，602 
See also list scheduling 
base types (基本 类 型 )，160-161 
Booleans (布尔 基本 类 型 )，161 
characters (字符 基本 类 型 )，161 
definitions (定义 基本 类 型 )，160 
numbers ( 数 基 本 类 型 )，160-161 
support (支持 基本 类 型 )，160 
See also type systems;type(s) 
batch collectors ( 批 回收 器 )，301 
defined (定义 批 回收 器 )，301 
phases (阶段 批 回收 器 )，301 
technique comparison ( 批 回收 器 技术 比较 )，304 
See also garbage collection 
BCPL (BCPL) 
cells (BCPL 单 元 )，156 
switch construct ( Switch 结构 )，364 
benchmarking 〈 基 谁 测试 ) 615 
biased coloring ( 偏 着 色 ) ，652-653 
binary search (二 分 搜索 ) 365-366, 687 
binary trees (二 叉 树 ) 681-682 
bit vectors (位 向 量 ) 677 
blocks ( 块 ) 
g-function ( 块 g 国 数 )，464，478 
boundary ( 块 边 界 ) 604 
boundary complications ( 块 边 界 处 的 复杂 性 )，631- 
633 
cloning ( 块 复制 )，426-427 
combining (结合 块 )，502 
DVN processing (DVN 处 理 块 )，434 
empty, removing ( 消除 空 块 )，501 
end, finding (寻找 块 的 尾部 )，440，441 
list scheduling application to (将 列表 调度 运用 于 块 )， 
595-596 ` 
multiple, problems (多 个 块 的 问题 )，632 
placement (放置 块 )，540 
precedence graph ( 块 的 优先 图 )，589 
state at end of ( 块 的 尾部 状态 ) 469 
unreachable (不 可 达 块 )，505 
booleans (布尔 )，322-333 
adding, to expression grammar (把 布尔 加 入 表达 式 
文法 )，323 
as base types (作为 基本 类 型 的 布尔 )，161 
implementing (实现 布尔 )，329 
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numerical encoding ( 数 编 码 布尔 ) 324-325 
pointer to 〈 指 向 布尔 的 指针 ) ，165 
positional encoding 〈 位 置 编码 布尔 ) 325-327 
representations (表示 布尔 )，323-328 
boolean-valued comparisons (布尔 值 比较 )，331 
bottom-up coloring ( 自 底 向 上 着 色 ) 644-646 
computing (计算 自 底 向 上 着 色 )，645 
functioning of ( 自 底 向 上 着 色 的 功能 )，645-646 
live range ordering ( 自 底 向 上 着 色 排 序 活 区 域 )，644 
removal process ( 自 底 向 上 着 色 消 除 过 程 )，645 
spill metric (使 用 溢出 度量 的 自 底 向 上 着 色 )，646 
See also global register allocation 
bottom-up local register allocators ( 自 底 向 上 局 部 寄存 器 
分 配器 )，626-629 
defined (定义 自 底 向 上 局 部 寄存 器 分 配器 ) 626 
illustrated (图 解 自 底 向 上 局 部 寄存 器 分 配器 ) 626 
net effect ( 自 底 向 上 局 部 寄存 器 分 配器 的 网 络 效 应 )， 
628 
top-down local allocator vs.( 自 底 向 上 局 部 寄存 器 分 
配器 与 自 顶 向 下 局 部 分 配器 )，629 
See also register allocation;register allocators 
bottom-up parsers ( 自 底 向 上 语法 分 析 器 )，107-120 
defined (定义 自 底 向 上 语法 分 析 器 ) 87 
derivations ( 自 底 向 上 语法 分 析 器 中 的 派生 )，107 
functioning of ( 自 底 向 上 语法 分 析 器 的 功能 )，107 
reduction ( 自 底 向 上 语法 分 析 器 中 的 归 约 )，141 
shift-reduce ( 自 底 向 上 语法 分 析 器 中 的 移 位 归 约 )， 
190 
states ( 自 底 向 上 语法 分 析 器 的 状态 )，110 
bottom-up parsing ( 自 底 向 上 语法 分 析 )，74，107-120 
critical step in (BRA LBRO PERRE), 
108-109 
failed (失败 的 自 底 向 上 语法 分 析 )，107 
handle-finding〈 自 底 向 上 语法 分 析 中 的 发 现 句柄 )， 
112-115 
partial parse trees for ( 自 底 向 上 语法 分 析 的 部 分 分 析 
树 )，111 
shift-reducing ( 自 底 向 上 语法 分 析 中 的 移 位 归 约 )， 
108-112 
successful (成 功 的 自 底 向 上 语法 分 析 )，107 
unambiguous grammar and ( 非 歧 义 性 文法 和 自 底 向 
上 语法 分 析 )，108 
branches (分 支 ) 
ambiguous (£& 247%), 505 
conditional (4% 4447), 328, 668 
fall-through (落下 分 支 )，553 
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hoisting (提升 分 支 )，502 

prediction (判断 分 支 )，358 

redundant, folding (#A AZE), 501 
break statement (breaki=%), 368 
bucket hashing ( 桶 散 列 ) 689-691 


adding lexical scopes to (把 词法 作用 域 加 到 桶 散 列 


中 )，695-696 
advantages ( 桶 散 列 的 优点 )，690 
assumptions ( 桶 散 列 假设 ) 689 
defined (定义 桶 散 列 )，686 
drawbacks ( 桶 散 列 的 缺点 )，690-691 
table 〈 桶 散 列 表 ) 690 
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for loop (for 循 环 )，359 ， 360-361 
scoping rules (作用 域 规则 )，259-260 
switch construct ( switch 结构 )，364 
cache memories (高 速 绥 存 )，293-295 
block sharing (高 速 缓 存 的 块 分 享 )，295 
defined (定义 高 速 缓存 ) 294 
frames ( 高速 缓 存 的 帧 ) 294 
mappings (高 速 缓存 的 映射 ) 294 
multiple levels (多 级 高 速 缓存 ) 599 
primer (高 速 缓 存 的 初步 )，294 
virtually addressed ( 虚拟 地 址 高 速 缓存 ) 295 
See also memory 
call by name (名 字 调 用 )，277 
call by reference (引用 调用 ) 276-279 
call by value vs.( 值 调用 与 引用 调用 )，277-278 
defined (定义 引用 调用 )，276 
example (引用 调用 的 例子 )，278 
parameter (引用 调用 参数 )，318，319 
space requirements (引用 调用 空间 需求 )，278 
call by value ( 值 调 用 )，275-276 
call by reference vs,《 引 用 调用 与 值 调用 ) 277-278 
defined (定义 值 调用 )，276 
parameters ( 值 调用 参数 ) 370 
results 〈 值 调用 结果 )，276 
space requirements ( 值 调用 空间 需求 )，278 
call graphs (调用 图 )，254，484 
distinct edge in (调用 图 中 的 不 同 边 )，484 
graphs derived from ( 从 调用 图 得 到 的 图 )，484 
callee saves (被 调用 者 保存 )，288 


callee-saves registers (被 调用 者 保存 的 寄存 器 )，288，371 
combining with caller-saves (与 被 调用 者 保存 的 寄存 


器 的 结合 )，372 
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preserving (保持 被 调用 者 保存 的 寄存 器 )，371 
caller-saves registers (被 调用 者 保存 的 寄存 器 )，371， 
372 
calling sequence (调用 序列 )，252 
candidate operations (候选 操作 )，530 
canonical collection of sets of LR(1) items (LR(1) 项 目 集 
合 的 规范 集合 )，120 
algorithm (LR(1) 项 目 集 合 的 规范 集合 的 算法 )，124- 
125 
closure procedure (LR(1) 项 目 集合 的 规范 集合 的 
C1losure 过 程 )，122-123 
constructing (构造 LR(1) 项 目 集合 的 规范 集合 )，122- 


127 
goto procedure (LR(1) 项 目 集合 的 规范 集合 的 goto 过 
程 )，124 


for SN (SN 的 LR(1) 项 目 集合 的 规范 集合 )，125-127 
states of handle-recognizing DFA (LR(1) 项 目 集合 的 
规范 集合 代表 句柄 识别 DFA 的 状态 ) 126 
case statement (选择 语句 ) 364-368 
binary search 〈 选 择 语 句 的 二 分 搜索 ) 365-366 
direct address computation (选择 语句 的 直接 地 址 计 
算 )，367 
implementing (实现 选择 语句 )，364-368 
linear search (选择 语句 的 线性 搜索 )，365 
while loop in (选择 语句 内 的 whi1e 循 环 )，367 
central repository (中 心 存储 库 )，187 
characteristic vectors 〈 字 符 向 量 )，677 
characters (字符 ) 
as base types (作为 基本 类 型 的 字符 )，161 
escape ( 转 义 字 符 )，40 
extra memory references per ( 每 个 字符 的 额外 内 存 引 
用 )，62 
processing (处 理 字 符 ) 67 
circular attribute grammars (循环 属性 文法 )，174，176- 
177 
approaches (使 用 循环 属性 文法 的 方法 ) 176-177 
defined (定义 循环 属性 文法 ) 174 
See also attribute grammars 
CISC machines, instruction selection and (复杂 指令 集 
计算 机 (CISC) OLA, em), 579 
class variables (类 变量 ) 262, 271, 380 
classes (类 ) 
creating (创建 分 类 )，375 
defined (#524738), 269, 271 
register (寄存 器 类 )，312，623-624 
single, no inheritance (单一 类 ， 无 继承 )，373-375 
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storage (类 存储 )，568 
structure (类 结构 )，376 
superclasses ( 超 类 )，271 
classic expression grammar (经 典 表 达 式 文法 )，85 
Action table for (经 典 表达 式 文 法 的 action 表 格 )， 
118 
defined (定义 经 典 表达 式 文法 ) 85 
Goto table for (经 典 表达 式 文 法 的 Goto 表 格 ) 119 
illustrated (图 解 经 典 表达 式 文 法 )，85 
parse tree using (使 用 经 典 表达 式 文法 的 分 析 树 ) ， 
214 
parser for (经 典 表达 式 文 法 的 语法 分 析 器 )，86 
right-recursive variant (经 典 表 达 式 文法 的 右 递归 变 
量 )，95 
See also grammars 
Clean algorithm (C1ean 算 法 ) 
Dead cooperation with (Clean 算 法 与 Dead 的 合作 )， 
. 504 
defined (定义 Clean 算 法 )，501 
illustrated (图 解 C1ean 算 法 ) 503 
transformation application (Clean 算 法 的 转换 运用 )， 
503 . 
transformation illustration (Clean 算 法 的 转换 说 明 )， 
502 
transformations (Clean 算 法 的 转换 )，501-502 
clean values (净值 )，628 
cloning (复制 ) 
blocks (复制 块 )，426-427 
for context (为 上 下 文 复制 )，614-617 
costs (复制 代价 )，427 
example illustration (复制 例子 说 明 )，426 
to increase context (通过 复制 增加 上 下 文 )，425-427 
for increasing scheduling context (为 增加 调度 的 上 下 
文 的 复制 )，616 
tail call (复制 一 个 尾 调 用 )，616 
closure ( 闭 包 ) 
Kleene (Kleene 闭 包 )，37，38 
positive ( 正 闭 包 )，38 
precedence (优先 闭 包 )，39 
regular expressions ( 闭 包 的 正则 表达 式 )，38 
transformations, applying (运用 闭 包 转换 )，48-49 
under concatenation (连接 下 的 闭 包 ， 封 闭 性 )，42 
closure procedure (closure 过 程 )，122-123，128 
coalescing live ranges (接合 活 区 域 )，646-647 
defined (定义 接合 活 区 域 )，646 
illustrated (图 解 接合 活 区 域 )，647 


performing (执行 接合 活 区 域 )，647 
two (接合 两 个 活 区 域 )，647 
See also live ranges 
code (代码 ) 
better, generating (生成 较 好 代码 )，157-159 
compensation (补偿 代码 )，606 
control-flow construct implementation (控制 流 结构 实 
现代 码 )，356 
defined (定义 代码 )，20 
hoisting (提升 代码 )，452，506，514-515 
improving (改进 代码 )，15-16 
layout (代码 结构 )，553 
pipelining (流水 线 代 码 )，611 
smaller, generating (生成 较 小 代码 )，538-539 
stack-machine ( 栈 机 器 代码 )，223，224 
templates (模板 代码 )，564 
three-address ( 三 地 址 代码 )，223，224-225 
three-register (三 寄存 器 代码 }，316 
transition diagrams (转换 图 表 代 码 )，31 
two-register (二 寄存 器 代码 )，316 
useless, eliminating (消除 无 用 代码 )，495，498- 
505 
writing (编写 代码 )，9 
code generation (代码 生成 )，16-23 
compilation problems during (代码 生成 期 间 的 复杂 问 
题 )，21 
instruction scheduling (代码 生成 的 指令 调度 ) 19- 
21 
instruction selection (代码 生成 的 指令 筛选 )，16-18 
interactions (代码 生成 的 相互 作用 )，21-22 
optimal (代码 生成 的 优化 )，557 
register allocation (代码 生成 的 寄存 器 分 配 )，18-19 
See also instruction selection 
code generators (代码 生成 器 )，554，555 
designing (设计 代码 生成 器 )，545 
efficient/effective (代码 生成 器 的 效率 )，569 
implementation (实现 代码 生成 器 )，568 
lower-cost sequences and ( 较 低 代价 序列 和 代码 生成 
器 )，565 
multiple addressing modes and (多 寻 址 模型 和 代码 生 
成 器 )，546-547 
tiling selection (代码 生成 器 的 铺盖 选择 )，564 
tree-walk (代码 生成 的 树 遍 历 )，318，562 
code motion (代码 移动 )，496，505-515 
hoisting use of (代码 移动 的 提升 使 用 )，506 
lazy (惰性 代码 移动 )，505，506-514 
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code optimization (代码 优化 )，15，383-432 
background (代码 优化 的 背景 )，、386-392 
considerations 〈 代码 优化 的 考虑 ) 388-392 
context, increasing (增加 上 下 文 的 代码 优化 ) 424- 
427 
goal (代码 优化 的 目的 )，385 
improvement forms (多 种 改良 形式 代码 优化 )，385 
introduction to (介绍 代码 优化 )，383-385 
levels of (代码 优化 层次 )，541 
objectives (代码 优化 目标 )，538-540 
opportunities (代码 优化 机 会 )，383，392 
performance gap (代码 优化 所 带 来 的 性 能 的 差异 )， 
386 
performance improvement (代码 优化 的 执行 改进 )， 
430 
procedure calls and (过 程 调用 和 代码 优化 )，427 
profitability and (有 效 性 和 代码 优化 )，390-391 
repeating (重复 代码 优化 )，541 
risk and (风险 和 代码 优化 )，391-392 
safety and (安全 性 和 代码 优化 )，388-390 
scope (作用 域 和 代码 优化 )，404-408 
selecting (选择 代码 优化 )，541 
sequence, choosing 〈 选 择 代码 优化 序列 ) 540-541 
See also optimization . 
code reuse (代码 复 用 )，269 
data-flow frameworks and (数据 流 框架 和 代码 复 用 )， 
452 
inheritance and (继承 和 代码 复 用 )，271 
code sequences for matches (匹配 的 代码 序列 )，564 
code shape (代码 形态 )，307-382 
alternate (不 同 的 代码 形态 )，308 
decisions ( 确定 代码 形态 )，315 
defined (定义 代码 形态 )，307 
examples (代码 形态 的 例子 )，308-309 
impact (代码 形态 的 影响 )，307 
memory model impact on (内 存 模型 对 代码 形态 的 影 
响 )，292-293 
memory-to-memory model and (内 存 到 内 存 模型 和 代 
码 形态 ) 292 
register-to-register model and (寄存 器 到 寄存 器 模型 
和 代码 形态 )，292-293 
code-space locality (代码 空间 的 位 置 )，104 
column-major order ( 列 优 先 顺序 )，335，336 
commutative operations ( 可 交换 操作 ) 400 
commutativity ( 可 交换 性 ) 321-322 
operations (可 交换 性 操作 ) 321 
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for reordering expressions ( 重 排序 表达 式 的 可 交换 
性 )，397 


comparison operator (比较 操作 符 )，668-669 
compensation code (补偿 代码 )，606 
compilation (编译 ) 


high-level view (编译 的 高 级 观点 )，8-23 

offline nature of (编译 的 脱 机 属性 )，674 

overview (编译 总 阅 )，1-26 

principles (编译 原理 )，4-5 

problems during code generation (代码 生成 期 间 的 编 
. 译 问题 )，21 

separate (分 块 编译 )，251 

techniques (编译 技术 )，22 


compilers (编译 器 ) 


back end (编译 器 后 端 )，5，549, 550, 551 

construction (构造 编译 器 )，3-4 

debugging (调试 编译 器 )，24，381，386 

defined (定义 编译 器 )，1 

desirable properties (编译 器 的 理想 性 质 )，23-24 

efficiency (高 效 编译 器 )，24 

as engineered objects (作为 工程 对 象 的 编译 器 )，4， 
10 

feedback (编译 器 的 反馈 )，23-24 

front end (编译 器 的 前 端 )，5，25，578 

fundamental role of (编译 器 的 基础 角色 )，3 

GCC (GCC 编 译 器 )，226 

interpreters vs. (翻译 和 编译 器 )，2-3 

multipass (多 遍 编 译 器 )，228 

Open64 (Open64 编 译 器 )，226 

optimizing (优化 编译 器 )，7，386 

PCC (PCC 编 译 器 )，226 

PL8 (PL8 编 译 器 )，226 

principles (编译 器 原理 ) 4-5 

research (编译 器 研究 )，2 

retargetable ( 可 重 定 目 标 编译 器 )，548-552 

source-to-source translators ( 编译 器 是 源 语 言 到 源 语 
言 翻译 器 )，2 

space (编译 器 的 空间 )，23 

speed (编译 器 的 速度 )，23 

structure (编译 器 的 结构 }，5-8 


` successful (成 功 的 编译 器 )， 4 


target program (编译 器 到 目标 程序 )，2 
three-phase (编译 器 的 三 阶段 )，6-8 


compile-time efficiency (编译 时 效率 ) 24 
compound objects (复合 对 象 )，151-152 
compound types (复合 类 型 ) 162-166 
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computations (计算 ) 
availability (可 用 性 计算 )，506 
costs (计算 代价 )，568 
direct address (直接 地 址 计算 )，367 
fixed-point (不 动 点 计算 ),，54,，55，125 
pointer-based (基于 指针 的 计算 )，166 
priority (计算 的 优先 级 )，598 
redundant, eliminating ( 宛 余 计算 消除 )，496 
specializing (计算 特 化 ) 495-496 
concatenation (连接 ) 
closure under (连接 下 的 封闭 性 )，42 
regular expressions (正则 表达 式 的 连接 )，38 
string ( 捉 的 连接 }，349 


transformations, applying (连接 转换 的 运用 )，48-49 


conditional branches (条 件 分 支 )，328 

operation (条 件 分 支 操 作 )，668 

two-label (两 标签 条 件 分 支 )，668 
conditional execution (条 件 执行 )，356-359 
conditional move (条 件 移 动 )，330-331 

advantage (条 件 移 动 的 优势 )，331 

example (条 件 移 动 示例 ) 330 

execution (条 件 移动 执行 )，331 
condition-code registers (条 件 代 码 寄 存 器 )，624 
conservative coalescing (保守 接合 )，652-653 
constant function types (常量 国 数 类 型 ) 203 
constant propagation (常量 传播 )， 452-454 

code motion (常量 传播 中 的 代码 移动 )，496 

global (全 局 常量 传播 )，453 

interprocedural (过 程 内 常量 传播 )，485-486 

reformulating (重新 形式 化 常量 传播 )，516 

sparse simple(SSCP) (稀疏 简单 常量 传播 )，516-518 
CONSTANTS sets (CONSTANTS 集 合 ) 


for code improvement ( 代码 改进 CONSTANTS 集 合 )， 


454 
defining (CONSTANTS# AEN), 453 
domain (CONSTANTS 集 合 的 定义 域 )，454 
constructed types (结构 类 型 ) 162-166 
context-free grammars ( 上下文 无 关 文 法 )}，75-79 
backtracking and (回溯 和 上下文 无 关 文 法 )，90 
construct recognition (上 下 文法 的 结构 识别 )，89 
defined (上 下 文 无 关 文法 的 定义 )，75 
example (上 下 文 无 关 文 法 的 示例 )，75 


languages defined by (由 上 下 文 无 关 文 法 定义 的 语 


4), 75 
microsyntax 记 〈《 上 下 文 无 关 文 法 中 的 微 语 法 )，89 
quadruple (四 元 组 上 下 文 无 关 文 靶 )，78 
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regular expressions vs. (正则 表达 式 与 上 下 文 无 关 文 
法 )，87-89 
as rewrite system (作为 重 写 系 统 的 上 下 文 无 关 文 法 )， 
79 
scanners and (扫描 器 和 上 下 文 无 关 文 法 )，89 
sentence construction (上 下 文 无关 文 法 中 的 语句 构 
造 )，79-83 
strings in (上 下 文 无 关 文法 中 的 串 )，172 
subclasses ( 上下文 无 关 文法 中 的 子 类 ) 75 
subsets (上下文 无 关 文 法 的 子 集 )，89，90 
See also grammars 
contexts (上下文 ) 
cloning for (上下文 的 复制 )，614-617 
increasing 〈 上 下 文 的 增加 )，425-427 
left (左上 下 文 )，122 
right (右上 于 文 )，70，122 
scanning (上 下 文 的 扫描 )，69-70 
context-sensitive ambiguity ( 上下文 相 关 的 歧义 性 )， 
136-138 l 
context-sensitive analysis ( 上下文 相 关 分 析 )，12，151- 
208 
ad hoc syntax-directed translation (专用 语法 导 制 的 翻 
译 的 上 下 文 相关 分 析 )，188-202 
attribute grammars (属性 文法 的 上 下 文 相 关 分 析 )， 
171-188 
defined (上 下 文 相关 分 析 的 定义 )，28，153 
type systems and (类 型 系统 和 上 下 文 相关 分 析 )， 
154-171 
context-sensitive grammars (上下文 相关 文法 )，201 
control abstraction (控制 抽象 ) 254-256 
control-flow analysis (控制 流 分 析 ) 484 
control-flow constructs 〈 控 制 流 结构 ) 355-368 
break statement (控制 流 结构 中 的 break 语 句 )，368 
case statement (控制 流 结构 中 的 选择 语句 )，364-368 
conditional execution (控制 流 结构 的 条 件 执行 )， 
356-359 
implementation code ( 实现 控制 流 结构 的 代码 )，356 
loops and iteration (控制 流 结构 中 的 循环 和 迭代 )， 
359-364 
control-flow graphs(CFGs) (控制 流 图 )，219-220 
back edges (控制 流 图 的 后 边 )，503 
basic blocks (控制 流 图 中 的 基本 块 )，219-220 
building (控制 流 图 的 构建 )，438，439-440 
construction complications (控制 流 图 构造 的 复杂 性 )， 
440-441 
defined (控制 流 图 的 定义 )，219 
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edges (Eml RRIA), 440 
entry nodes 〈 控 制 流 图 的 入 口 结 点 )，219 
example (控制 流 图 的 示例 )，683 
execution frequencies and (执行 频率 和 控制 流 图 )， 
638 
graphical representation (控制 流 图 的 图 表示 )，219 
illustrated (图 解 控 制 流 图 )，220 
implementation tradeoff (控制 流 图 实现 的 权衡 )，219 
irreducible (不 可 归 约 控制 流 图 )，480，481，483 
reducible ( 可 归 约 控制 流 图 )，480，481 
successors (控制 流 图 的 后 继 )，472 
from target-machine code (目标 机 器 代码 的 控制 流 
图 )，440 
for trail-recursive routine 〈 尾 递归 例 程 的 控制 流 图 ) , 
616 
uses 《控制 流 图 的 使 用 )，220 
control-flow operations (控制 流 操作 )，576-577，667- 
670 
predicated (预测 控制 流 操作 )}，576-577 
presence of (控制 流 操 作 的 存在 )，576 
conversion algorithm (转换 算法 )，66 
copy folding (HARA), 478 
copy operations ( 拷贝 操作 ) 403, 656 
copy rules (拷贝 规则 ) 
attribute grammar size and (属性 文法 有 大 小 的 拷贝 规 
WW), 185 
defined (拷贝 规则 的 定义 )，182 
to track loads〈 跟 踪 装 入 的 拷贝 规则 )，183 
copying collectors (复制 回收 器 ) ，301，303-304 
defined (定义 复制 回收 器 )，303 
generational (生成 的 复制 回收 器 )，304 
stop and copy (停止 和 拷贝 复制 回收 嚣 )，303 
technique comparison (复制 回收 器 的 技术 比较 )，304 
See also garbage collection 
copy-insertion algorithms (# AA RY), 478 
correctness (iE MATE), 4 
importance (重要 的 正确 性 )，389 
LiveOUT (LiveOUT 的 正确 性 )，445 
syntactic (语法 的 正确 性 )，12 
cost functions (代价 国 数 ) 568 
critical edges (临界 边 ) 
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execution (关键 路 径 的 执行 )，611 

execution time and (执行 时 间 和 关键 路 径 )，591 
cycle of constructions (构造 法 的 循环 关系 1，44-45 

consequences (构造 法 的 循环 关系 的 结论 ) 47 

illustrated (图 解构 造 法 的 循环 关系 )，45 


D 


data areas (数据 区 )，309 

constraints (数据 区 的 限制 )，310 

global variables (全 局 变量 数据 区 )，290-291,，310 

laying out (数据 区 布局 )，310 

static variables (静态 变量 数据 区 )，290-291，310 
data structures (数据 结构 )，673-701 

doms (doms 数 据 结 构 )，674 

hash table implementation ( 散 列表 实现 数据 结构 )， 

686-698 

IR implementation (数据 结构 的 IR 实 现 )，679-686 

representing sets (数据 结构 的 表示 和 集合 )，674-679 

sizes needed for (数据 结构 所 需要 的 大 小 )，673 
data-flow analysis (数据 流 分 析 )，417，433-490 

assumptions (数据 流 分 析 假 设 )，448 

defined (定义 数据 流 分 析 )，15 

global problem (数据 流 分 析 的 全 局 问题 )，421 

imprecision (数据 流 分 析 的 不 精确 性 ) 448 

insights (观察 数据 流 分 析 )，491 

iterative (迭代 的 数据 流 分 析 ) ，435-454 

limitations on (数据 流 分 析 的 限制 )，447-450 

live variables ( 活 变 量 )，435-444 

naming sets in (数据 流 分 析 中 的 命名 集合 )，449 

precision limitation (数据 流 分 析 的 精度 限制 )，448 

procedure calls and (过 程 调用 和 数据 流 分 析 )，450 

scope, extending (扩展 数据 流 分 析 作 用 域 )，479 

sets (数据 流 分 析 集 合 )，700 

SSA form (数据 流 分 析 的 SSA 形 式 )，454-479 
data-flow frameworks (数据 流 框架 )，491 

code reuse and (数据 流 框架 和 代码 复 用 )，452 

constants found by (数据 流 框 架 所 发 现 的 常量 )，517 

implementing ( 数据 流 框架 的 实现 ), 452 
data-flow problems (数据 流 问 题 ) 450-454 

available expressions (数据 流 问题 的 可 用 表达 式 )， 

450 





defined (临界 边 的 定义 )，475 
not splitting (不 分 离 临 界 边 )，476 
_ Splitting (分 离 临 界 边 )，475，479 
unsplit (不 分 离 临 界 边 )，478 


critical paths (关键 路 径 )，591 


constant propagation (常量 传播 数据 流 问题 )，452- 
454 

global, equations for (数据 流 问题 的 全 局 方程 )，452 

reaching definitions (数据 流 问题 的 可 达 定 义 )，450- 
451 
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very busy expressions (非常 忙碌 表达 式 数 据 流 问题 )， 
451-452 
dead values (死亡 值 )，575-576 
example (死亡 值 示 例 )，575 
frequently (频繁 死亡 值 )，575 
See also values 
dead variables (死亡 变量 )，575 
dead-code elimination (死亡 代码 消除 )，422，493 
deallocation, implicit (Aik), 299-305 
debugging (调试 )，24，229 
debugging compilers (调试 编译 器 ) 24, 381, 386 
defined (调试 编译 器 的 定义 )，386 
optimizing compilers vs. ( 调试 编译 器 和 优化 编译 器 )， 
386 
declarations (声明 ) 
omission (声明 忽略 )，202 
processing (声明 处 理 )，198-202 
syntax (语法 声明 )，199，200 
“declare before use” rule (“使 用 前 声明 ”规则 )，153 
definition points (定义 点 )，221 
delay (等 待 ) 597 
best-case (最 好 情况 等 待 )，599 
memory operation (内 存 操作 等 待 )，599 
slots (#4444), 441 
worst-case (最 坏 情 况 等 待 )，599 
deletion sets (删除 集合 ) 507 
Delta operations (Delta 操 作 ) 54 
dependence analysis (相关 性 分 析 ) 15-16 
dependence graphs (依赖 图 )，221-222 
building (依赖 图 构建 )，595 
complexity (依赖 图 的 复杂 性 )，222 
control flow interaction (控制 流 与 依赖 图 之 间 互 相 作 
FA), 222 
defined (依赖 图 的 定义 ) ，221，589 
edges (依赖 图 的 边 ) 221 
example (依赖 图 的 示例 )，590 
illustrated ( 图解 依赖 图 ) 221, 602 
node mapping (依赖 图 的 结 点 映射 )，589 
property capture (依赖 图 的 性 六 刻画 )， 591 
roots (依赖 图 根 )，589 
uses (依赖 图 的 使 用 )，222 
derivations (派生 ) 
bottom-up parser ( 自 底 向 上 语法 分 析 器 中 的 派生 )， 
107 
constructing (派生 构造 )，86 
example sentence (派生 例句 )，11 


graphic depiction (派生 图 描述 }，80 
leftmost (HAYR4E), 81, 91 
order (派生 顺序 ) 108 
parse tree equivalent (分 析 树 等 价 派生 )，86 
rightmost (最 右派 生 )，81，82，108 
specific, discovering (特定 派生 发 现 ) 86-87 
tabular form (表格 形式 ) 77 
deterministic finite automata(DFAs) (确定 性 有 穷 自动 
BL), 44 
with cyclic transition graph (转换 图 带 有 循环 的 DFA )， 
59 ` 
defined (DFA 的 定义 ), 46 
deriving regular expression from (从 DFA 得 到 正则 表 
达 式 )，59 
equivalent NFA (与 NFA 等 价 的 DFA)，47 
handle-recognizing (句柄 识别 DFA)，114 
language acceptance by ( DFA 接受 的 语言 )，44 
minimization algorithm (DFA 最 小 化 算法 )，56 
minimizing (DFA 最 小 化 )，56 
NFA simulation ( 与 NFA 的 相似 性 ) 60 
numbered states (DEFA 的 已 编号 状态 ) 59-60 
predictive parsers vs. (预测 语法 分 析 器 和 DFA ) 102 
as recognizers (作为 识别 器 的 DFA)，60-61 
regular expression construction from (从 DFA 构 造 正 
则 表达 式 )，59-60 
scanner implementation with (DFA 与 扫描 器 实现 )， 
62 
seven-stage (七 状态 DFA)，63 
subset construction (DFA 的 子 集 构造 )， 44, 53, 55- 
56 
table generation from (从 DFA 的 表格 生成 )，63 
table-driven implementation (DFA 的 表 驱 动 实现 )，62 
transition diagram (DFA 的 转换 范式 )，59 
transition tables (DFA 转 换 表格 )，558 
detour operator (detour 操 作 符 )，665 
direct-coded scanners (直接 编码 扫描 器 )，64 
directed acyclic graphs (DAGs) (有 向 无 环 图 )，216-217 
defined (有 向 无 环 图 的 定义 )，216-217 
hash-based constructor (有 向 无 环 图 的 基于 散 列 的 构 
Je), 396, 397 
nodes〈《 有 向 无 环 图 的 结 点 ) 217, 394 
nodes with multiple parents (#A S724 RNA W] 
无 环 图 结 点 )，394 
redundancy elimination with (有 向 无 环 图 和 宛 余 消 
除 )，394-398 
uses (有 向 无 环 图 的 使 用 ) 217 
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dirty values (4E4{#), 628, 629 
disjoint-set union-find algorithm (不 相交 集合 并 集 寻 找 
算法 )，636 
dispatching 〈 分 派 )，273 
displays (显示 ) 
defined (显示 的 定义 )，283 
global (全 局 显示 )，283-285 
managing (映射 显示 )，290 
distributivity (分 配 性 )，397 
”do loop (do 循环 )，361-362 
defined (do 循环 定义 )，361 
form (do 循环 的 形式 )，361 
index variables (do 循环 的 索引 变量 ) 362 
DOM (DOM) 
finding (DOM# 4%), 460 
sets (DOM##4}, 459 
sets, intersecting (443A DOM#4), 460 
dominance (支配 ) 457-463 
defined (支配 定义 )，457 
for LiveOUT example (LiveOUT 示 例 的 支配 )，458 
dominance frontiers (支配 边界 )，457，460-463 
computing (计算 支配 )，461-462 
defined (支配 边界 的 定义 )，461 
example (支配 边界 的 示例 )，462-463 
‘results (支配 边界 的 结果 )，463 
reverse〈 反 向 支配 边界 ) ，500 
dominator trees (支配 者 树 )，416，459 
defined (支配 者 树 的 定义 ) 416 
depth (支配 者 树 的 深度 ) 474. 
illustrated (图 解 支 配 者 树 )，416，458 
preorder walk over (前 序 遍 历 支配 者 树 ) 671 
dominator-based value numbering (基于 支配 者 的 值 编 
号 )，413-417 
block processing (基于 支配 者 的 值 编号 的 块 处 理 )， 
434 
dominators (基于 支配 者 的 值 编号 中 的 支配 者 )，415- 
416 
facts collection (基于 支配 者 的 值 编号 建立 的 事实 集 
合 )，491 
IDom (基于 支配 者 的 值 编号 中 的 立即 支配 者 ) 415, 
416-417 
See also value numbering 
dominators (支配 者 )，415-416 
computing (计算 支配 者 )，457-459 
relationship (支配 者 关系 )，415 
dope vectors (内 情 向 量 )，342-343 


defined (内 情 向 量 的 定义 ) 342 

illustrated (图 解 内 情 向 量 ) 342 
dynamic analysis (动态 分 析 )，436 
dynamic method lookup (动态 方法 查找 )，377 
dynamic register renaming (动态 寄存 器 的 重 命名 )，604 
dynamic scoping (动态 作用 域 ) 261 
dynamically checked languages (动态 检查 语言 )，169 
dynamically scheduled machines (动态 调度 机 器 )，604 
dynamically typed languages (动态 类 型 语言 )，156， 

169 


E 


earliest placement (最 早 放 置 )，506，510-511 
computing (计算 最 早 放 置 )，510 
equations (最 早 放 置 方程 )，510-511 
See also anticipable expressions;later placements 
efficiency (效率 ) 
duplication and (重复 和 效率 )，464 
- improving (效率 改进 )，459-460 
list scheduling (列表 调度 的 效率 )，598-599，604 
LiveOUT (LiveOUT 的 效率 )，445-447 
enabling transformations ( 沿 活 转换 )，496，518-522 
defined (激活 转换 的 定义 )，518 
loop unrolling (循环 展开 激活 转换 )，519-520 
loop unswitching (循环 反切 换 激 活 转 换 )，520-521 
renaming ( 重 命 名 激活 转换 )，521-522 
types of (激活 转换 的 类 型 )，518 
See also transformations 
encoding (编码 ) 
naive (naive 编 码 )，325 
numerical ( 数字 编码 ) 324-325 
positional ( 位置 编码 )，325-327 
recognizers into table set (识别 器 编码 成 一 组 表格 )， 
35-36 
syntactic structure ( 编码 语法 结构 )，78 
enumerated types (〈 枚 举 类 型 ) 163-164 
epilogue sequences (结语 序列 ) 286, 287 
error(s) (错误 ) 
action (错误 动作 )，117 
detection (错误 发 现 )，110 
recovery (错误 恢复 )，134-135 
syntax (语法 错误 )，110，134 
type (错误 类 型 )，167-168 
escape characters (转换 字符 )，40 
evaluated parse trees (评估 分 析 树 )，172 
evaluator generator (评估 器 生成 器 )，175 
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execution history (447759), 254 
execution-time estimator (执行 时 间 估 测 器 )，179-180 
attribute grammar (执行 时 间 估 测 器 的 属性 文法 )， 
180 
final improvement to (对 执行 时 间 估 而 器 的 最 后 改 
3), 184-185 
improving (执行 时 间 估 测 器 的 改进 ) 180-183 
exhaustive search ( 穷 举 搜索 )，582 
explicit length field (显示 长 度 字段 )，350 
expressions (表达 式 ) 
anticipable ( 可 前 置 表达 式 ) 509-514 
available (可 用 表达 式 )，404，417-418 ，419-421， 
504, 508-509 
boolean (布尔 表达 式 )，322 
function calls in (表达 式 中 的 函数 调用 )，319 
ILOC generation fro (表达 式 的 ILOC 生 成 器 )，197- 
198 
mixed-type (混合 型 表达 式 )，320 
names (表达 式 名 字 )，419 
operands (表达 式 操作 数 )，231 
predicate (谓词 表达 式 )，332 
redundant ( 宛 余 表 达 式 )，393-404 
relational (关系 表达 式 )，322 
reordering (表达 式 重 排序 )，397 
tree-walk for (表达 式 的 树 遍历 )，314 
trivial, code generation for (表达 式 的 平凡 代码 生成 )， 
313 
type inference for (表达 式 的 类 型 引用 )，168-170， 
177-179, 195 
very busy 《非常 忙碌 表达 式 ) 451-452 
expressiveness (表示 能 力 ) 
improving (改进 表示 能 力 )，156-157 
IR (IR 表 示 能 力 )，212-213 
extended basic blocks (EBBs) (扩展 的 基本 块 )，405 
local technique extension to (局 部 技术 到 扩展 的 基本 
块 的 推广 )，413 . 
maximal-size( 极 大 扩展 的 基本 块 )，405 
scheduling (扩展 的 基本 块 的 调度 )，605-607，608 
scheduling paths through (通过 扩展 的 基本 块 的 调度 
路 径 )，607 
tree structure (扩展 的 基本 块 的 树 结构 )，408 
trivial (平凡 的 扩展 的 基本 块 )，605 
external interfaces ( 外 部 接口 ) 253 


F 


fall-through branch (# F&a £), 553 





false zero ( 伪 零 )，338 
computing ( 伪 零 计算 )，340 
defined ( 伪 霉 定义 )，334 
feedback (反馈 )，23-24 
fields (字段 )，270 
finite automata (FA) (有 穷 自 动机 )，31-33 
defined (ASH MELE M), 27, 31 
deterministic (DFAs) (确定 性 有 穷 自动 机 )，44 
encountering errors (有 穷 自 动机 遇见 错误 )，33 
five-tuple (五 元 组 有 穷 自 动机 )，31 
formalism (有 穷 自 动机 的 形式 定义 )，32 
initial state (有 穷 自动 机 的 初始 状态 )，32 
merging (合并 有 穷 自动 机 )，46 
nondeterministic (NFAs) ( 非 确定 性 有 穷 自 动机 )，44， 
45-50 
number of states ( 有 穷 自 动机 的 状态 数量 ) 42 
operation cost (有 穷 自动 机 的 操作 代价 )，41 
power (有 穷 自 动机 的 威力 )，37 
regular expressions and (正则 表达 式 和 有 穷 自动 机 )， 
36, 44 
for signed integers ( 带 符 号 整数 的 有 穷 自动 机 )，35 
` simplifying (简化 有 穷 自 动机 )，34 
string acceptance (有 穷 自 动机 的 可 接受 串 )，32 
for unsigned integers (无 符号 整数 的 有 穷 自动 机 )， 
37 
first-fit allocation (首次 拟 合 分 配 ) 296-298 
defined (首次 拟 合 分 配 的 定义 ), 296 | 
free list (首次 拟 合 分 配 的 自由 列表 )，296 
gola (首次 拟 合 分 配 的 目标 )，296 
variations (首次 拟 合 分 配 的 变形 )，297-298 
fixed-point computations (不 动 点 计算 )，54，125 
&-closure (&-closure 的 不 动 点 计算 )，55 
defined (不 动 点 计算 的 定义 )，54 
termination arguments (不 动 点 计算 的 终止 参数 )，54 
floating-point numbers ( 浮 点 数 )，160 
floating-point operations ( 浮 点 操作 )，547 
floating-point registers ( 浮 点 寄存 器 ) 623 
flow-insensitive methods ( 流 非 敏感 方法 ) 486 
flow-sensitive methods ( 流 敏感 方法 )，486 
fluff removal (错误 清除 )，540 
for loop (for 循 环 )，359，360-361 
canonical shape (for 循 环 的 规范 形态 )，361 
code layout (for 循 环 代码 布局 )，360 
mapping (for 循 环 映 射 )，360 
two-block (两 块 的 for 循 环 )，361 
FORTRAN (FORTRAN) 
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arrays (FORTRAN 的 数组 ) 684-685 
do loop (FORTRAN 中 的 do 循环 )，361-362 
properties (FORTRAN 的 性 质 ) 67 
right context and (右上 下 文 和 FORTRAN )，70 
scanning (FORTRAN 的 扫描 )，68 
scoping rules (FORTRAN 的 作用 域 规则 )，259 
two-pass scanners (FORTRAN 的 两 遍 扫描 器 ) 69-70 
forward list scheduling (向 前 列表 调度 ) 600-603 
backward list scheduling vs. (向 后 列表 调度 与 向 前 列 
表 调 度 )，601 
defined (向 前 列表 调度 的 定义 )，601 
operation order and (操作 顺序 和 向 前 列表 调度 )， 
601 
priority (向 前 列表 调度 优先 级 )，601-602 
See also list scheduling 
forward substitution (向 前 替换 )，579 
frames, cache (高 速 缓冲 帧 ) 294 
free list (自由 表 )，296 
free routine (free 例 程 )，297，299 
free variables (自由 变量 )，261 
front end ( 前端) 
defined (前 端 定义 )，5 
focus (前 端 集 中 于 )，25 
LLIR generation (前 端 LLIR 生 成 )，578 
See also back end;compilers 
function calls (函数 调用 )，319 
functions ( FRX) 
cost 《函数 代价 )，568 
defined ( HBS), 251 
hash (#7) RB), 688-689 
jump ( 跳 转 函数 )，485 
returning values from (从 函数 的 值 返 回 )，279 
side effects ( 函数 的 副作用 )，319 
trampoline ( 蹦床 图 数 ) 379-380 
virtual ( 虚 图 数 ) 392 
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garbage collection (垃圾 回收 )，299-305 

batch collectors (垃圾 回收 中 的 批 回 收 器 )，301 

conservative collectors (垃圾 回收 中 的 保守 回收 器 )， 
302-303 ， 

copying collectors (垃圾 回收 中 的 拷贝 回收 器 ) 303- 
304 

defined (垃圾 回收 的 定义 ) 299 

mark-sweep collectors (标记 清除 回收 器 ) 303 

precise collectors (精确 回收 器 的 垃圾 回收 )，302 
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real-time collectors 《实时 回收 器 的 垃圾 回收 )，305 
reference counting (执行 垃圾 回收 的 引用 计数 )， 
300-301 
techniques comparison (垃圾 回收 的 技术 比较 )，304- 
305 
work associated with (与 垃圾 回收 相关 的 工作 )， 
299-300 
garbage-collecting allocators (垃圾 回收 分 配器 )，298 
GCC compiler (GCC 编 译 器 )，226，579 
general-purpose registers (通用 寄存 器 )，623 
generational collectors (世代 回收 器 )，304 
global data-flow algorithms (全 局 数据 流 算法 )，421 
global display (全 局 显示 )，283-285 
access links vs.( 存 取 链 和 全 局 显示 )，285 
current (当前 全 局 显示 )，285 
defined (全 局 显示 的 定义 )，283 
maintenance (维护 全 局 显示 )，285 
managing (管理 全 局 显示 )}，290 
overhead (全 局 显示 的 负担 )，285 
references through (通过 全 局 显示 的 引用 )，285 
updates (更 新 全 局 显示 )，285 
use illustration (使 用 图 示 的 全 局 显示 )，284 
global methods (全 局 方法 )，407 
global redundancy elimination (全 局 元 余 消 除 )，417- 
424 
algorithm comparison (全 局 元 余 消 除 的 算法 比较 )， 
423 
available expression computation (可 用 表达 式 计算 的 
全 局 元 余 消 除 )，419-420 
improvements (全 局 元 余 消 除 的 改进 )，424 
redundant computation replacement (取代 宛 余 计算 的 
全 局 风 余 消除 ) 421-422 
role of names (全 局 元 余 消除 中 的 名 字 作 用 )，418- 
419 
global register allocation (全 局 寄存 器 分 配 )，633-651 
bottom-up coloring 〈 自 底 向 上 着 色 全 局 寄存 器 分 配 )， 
644-646 
decisions (寄存 器 分 配 决 策 )，634 
live ranges (全 局 寄存 器 分 配 中 的 话 区 域 ) 635-637 
local allocation vs. (局 部 分 配 和 全 局 寄存 器 分 配 )， 
633-634 
spill cost estimation (全 局 寄存 器 分 配 的 溢出 代价 评 
估 )，637-638 
top-down coloring ( A MH FRED WAH a Ac), 
642-643 


See also register allocation 
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global spill costs (全 局 溢出 代价 ) 637-638 
estimating (评估 全 局 溢出 代价 ) 637-638 
execution frequencies and (执行 频率 和 全 局 溢出 代 
价 )，638 
infinite (无 限 全 局 溢出 代价 )，638 
negative ( 负 全 局 谥 出 代价 ) 638 
See also spilling 
global variables (全 局 变量 ) 
access to (全 局 变量 的 存 取 )，280 
data areas 《全 局 变量 数据 区 )，290-291，310 
labeling (全 局 变量 标签 )，281 
goal symbols (上 自 标 符号 )，78，79 
defined (目标 符号 定义 )，75 
unique (惟一 的 目标 符号 )，120 
goto procedure (goto 过 程 )，124 
: Goto table (Goto##e), 116, 117, 119 
directly encoding (Goto 表 格 的 直接 编码 )，145-147 
“don’t care” states (Goto 表 格 中 的 “无 关 ” 状 态 )， 
146 
filling in (Goto 表 格 填充 )，127-129 
non-error entries (Got0 表 格 中 的 非 出 错 条 目 ) 128 
See also LR(1) tables 
grammar rules (文法 规则 }，78 
grammars (文法 ) 
adding parentheses to 〈 在 文法 中 加 入 括号 ) 85 
ambiguous (歧义 性 文法 )，81，133 
attribute (属性 文法 )，171-188 
backtrack-free (无 回溯 )，94 
classic expression (经 典 表 达 式 文法 )，85 
context-free (上 下 文 无 关 文 法 )，75-79 
context-sensitive (上 下 文 相 关 文 法 )，201 
defined (文法 定义 )，10, 75 
engineering (设计 方法 )，140 
fixed (固定 的 文法 )，112 
left-factoring 《文法 的 左 因子 分 解 )，101 
left-linear ( 左 线性 文法 ) 87 
left-recursion 〈 左 递归 文法 ) 92 
LLY) (LL(1) 文 法 )，88，102 
LR(1) (LR(1) 文 法 )，88 
optimizing (文法 优化 )，141-143 
parser (语法 分 析 器 中 的 文法 )，70 
for programming languages (程序 设计 语言 的 文法 )， 
10 
reduced expression (缩小 表达 式 文法 ) 146 
regular (正则 文法 )，87，88 
right-recursive expression ( 右 递 归 表 达 式 文法 )，97，98 
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shorter variations (文法 的 更 短 变形 )，141 
shrinking (缩小 文法 )，144-145 
syntactic structure, encoding (语法 结构 文法 编码 )， 
78 
graph coloring (图 着 色 )，634-635 
defined (图 着 色 定 义 )，634 
dominant operations ( 图 着 色 中 的 支配 操作 )，684 
illustrated ( 图解 图 着 色 ) 635 
paradigm (图 着 色 范例 )，634 P 
variations ( HETE), 651-654 
graphical IRs (图 示 IR)，213-222 
defined (图 示 IR 定 义 )，210 
graphs (图 示 I[R 图 )，218-222 
implementing (图 示 IR 的 实现 )，679-684 
syntax-related trees (图 示 IR 的 语法 相关 树 )，213-218 
See also intermediate representations(IRs) 
graph-reduction process (图 归 约 过 程 )，480 
graphs (图 )，218-222 
arbitrary, representing (任意 图 表示 ) 682-684 
call (调用 图 )，254 
control-flow (控制 流 图 ) 219-220, 439-441, 472, 
480-481 
dependence (相关 图 )，221-222，589 
directed acyclic (DAGs) (有 向 无 环 图 )，216-217 
interference (hX), 639-641, 684 
irreducible (AV af 9429) ), 480-483 
precedence (优先 图 )，589 
tabular representation of ( 图 的 表格 表示 )，700 


H 


handle-recognizing DFA (句柄 识别 DFA )，114 
for SN (SN 的 句柄 识别 DFA ) 127 
states 《句柄 识别 DFA 的 状态 ) 126 
handles (句柄 ) 
complete (完整 句柄 )，114 
finding (Pew), 112-115 
finite set of ( 句柄 的 有 限 集合 )，114 
position fields 〈 句 柄 的 位 置 域 )，113 
potential (可 能 的 句柄 )，113，114 
potential, set of ( 可 能 的 句柄 集合 ) 114 
representation ( 句柄 表示 )，113 
hash functions 〈 散 列 函 数 ) 239, 240, 688-689 
choosing 〈 散 列 函 数 的 选择 ) 688, 689 
impact 〔( 散 列国 数 的 影响 ) 689 
multiplicative (乘法 散 列 函数 )，688 
poor 《拙劣 的 散 列 函数 )，689 
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universal (通用 散 列 函数 ) 688 
hash tables ( 散 列 表 )，239-241，534，687 
defined ( 散 列 表 定 义 )，239-240 
implementation ( 散 列表 的 实现 )，240 
index ( 散 列 索引 )，699 
replacing 〈 散 列表 取代 )，241 
as representation for sparse graphs (作为 稀 朴 图 表示 
的 散 列 表 ) 240 
two-dimensional (二 维 散 列表 ) ，698-699 
uses (使 用 散 列 表 )，240 
See also symbol tables 
hash-based constructor (基于 散 列 的 构造 器 )，396，397 
hashing ( 散 列 )，241 
bucket ( 桶 散 列 ) 686, 689-691 
open (开放 散 列 ) 686, 689-691 
perfect (完美 散 列 )，65 
heap( 堆 ) 
defined ( 堆 定 义 )，295 
explicitly managed ( RAHET), 295-296 
first-fit allocation (首次 拟 合 分 配 堆 )，296-298 
management algorithms (管理 堆 算法 )，295-299 
multipool allocators 〈 堆 的 多 字 分 配器 ) 298-299 
storage allocation 〈 堆 的 存储 分 配 )，310 
value lifetimes 〈 堆 中 的 值 的 生存 期 )，310 
heap allocated ARs (H4 RJAR), 266-267, 289 
hoisting (4251+), 514-515, 539 
code motion (提升 代码 移动 )，506 
code shrinkage (提升 的 代码 缩小 )，539 
defined (提升 的 定义 )，506 
Hollerith constant (Hollerith 常 量 )，67 
Hoperoft’s algorithm (Hoperoft 算 法 )，55-59 
hybrid IRs (混合 型 IR), 211 


identifiers (标识 符 ) 
classification based on declared type (基于 声明 类 型 
的 分 类 标识 符 ) ，137 
keywords as (作为 标识 符 的 关键 字 )，65 
tokens (记号 标识 符 )，241 
IDom (IDom), 415, 416-417 
array (IDom 数 组 )，460 
defined (IDom 定 义 )，415 
illustrated ( 图解 IDom)，416 
as key to finding DOM (寻找 [DOM 关键 的 IDom ) ， 
460 
using (1Dom 的 使 用 )，416-417 
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See also dominator-based value numbering 
if-then-else ambiguity (1f-then-else 歧 义 性 )，81- 
82, 121 
if-then-else constructs (if-then-else#yi#), 30, 
34, 356 | 
as ambiguous construct example (作为 歧义 性 构造 示 
例 的 1f-then-eise 构 造 )，81-82 
control flow inside (if-then-else 构 造 内 的 控制 流 )， 
359 
frequency of execution (if-then-e1se 构 造 的 执行 频 
HB), 358-359 | 
implementation strategy (if-then-e1se 构 造 实现 策 
略 )，356 
nested (if-then-else Atk), 34, 364 
predication vs. branching (if-then-else 构造 的 预测 
和 分 支 )，358-359 
uneven amounts of code (if-then-else 构 造 的 代码 
不 平均 量 ) ，359 
ILOC (ILOC), 659-672 
abstract machine (ILOC 抽 象 机 器 ) 659 
alternate branch syntax (ILOC 的 其 他 分 支 语 法 )， 
668-669, 672 
arithmetic operations (ILOC 的 算术 操作 ) 662-663 
basic block (ILOC 的 基本 块 )，221 
conditional move (ILOC 的 条 件 移 动 )，330-331 
control-flow operations (ILOC 的 控制 流 操 作 )，667- 
670, 672 
defined (ILOCHI# X), 17, 659 
example (ILOC 的 示例 )，666-667 
generating, for expressions (ILOC 的 表达 式 生成 )， 
197-198 
jump operation (1LOC 的 跳 转 操 作 )，669-670 
load address-immediate instruction (ILOC 的 装 人 地 址 
立即 指令 )，317-318 
memory operations (ILOC 内 存 操作 )，237，664-665 
naming conventions (ILOC 的 命名 约定 ) 662 
opcode summary (ILOC 操 作 码 的 总 括 )，671 
operands (ILOC 的 操作 数 ) 661 
operations (ILOC 操 作 ) 660, 662-665 
programs (ILOC 程 序 )，660 
register-to-register copy (ILOC 的 寄存 器 到 寄存 器 操 
作 )，665 
shift operations (ILOC 的 移 人 操作 ) ，663-664 
SSA form representation (ILOC 的 SSA 形 式 表 示 )，670 
this book 〈 本 书 中 的 ILOC ) 237 
virtual registers, renaming (ILOC 的 虚拟 寄存 器 的 重 
命名 )，230 
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implicit deallocation ( 隐 式 释放 )，299-305 
indirection vectors (间接 向 量 )，335，340-341 
defined (间接 向 量 的 定义 )，336 
reference requirement (间接 向 量 的 引用 需求 )，341 
in row-major order〈 行 优先 顺序 中 的 间接 向 量 ) ，337 
using (使 用 间接 向 量 )，340 
See also arrays 
induction variables (归纳 变量 )，529,，530，531，532 
creation (归纳 变量 的 创建 )，534-535 
dead (死亡 归纳 变量 )，537 
defining ( 归纳 变量 定义 )，531 
in hash table ( 散 列 表 中 的 归纳 变量 )，534 
initial value of ( 归纳 变量 的 初始 值 )，535 
See also variables 
inference (推理 ) 
declarations and (声明 和 推理 )，168 
for expressions (表达 式 推理 )，168-170 
rules (推理 规则 )，167-168 
inheritance (继承 )，271-272 
code reuse and (代码 复 用 和 继承 )，271 
complication (继承 的 复杂 性 ),, 375 
defined (继承 的 定义 )，271 
hierarchy (继承 层次 )，376 
implementing (继承 的 实现 )，376 
multiple ( 多重 继 承 )，378-379 
no ( 非 继 承 )，373-375 
single (单一 继承 )，375-377 
See also object-oriented languages 
inherited attributes (继承 属性 )，173 
inline substitution ( AREER), 427-430 
after (内 联 替 换 之 后 ) 429 
before (内 联 替换 之 前 ) ，428 
defined (内 联 替 换 的 定义 )，429 
improvements (内 联 替 换 的 改进 ) 429-430 
as interprocedural analysis alternative (作为 过 程 内 分 
析 选 择 的 内 联 替 换 )，487 
operation elimination (内 联 替换 的 操作 消除 )，430 
optimization effectiveness (内 联 替换 的 优化 效率 ) ， 
429 
potential pitfalls (内 联 赫 换 的 潜在 隐患 )，430 
insertion sets (插入 集合 )，507 
instances (实例 )，270 
instruction schedulers (指令 调度 器 ) 
alternative strategy (指令 调度 器 的 选择 策略 )，592 
constraints, freeing ( 从 限制 中 释放 指令 调度 器 )，592 
goals (指令 调度 器 的 目标 )，586 


input (指令 调度 器 的 输入 )，586 

multiple blocks and (多 个 块 和 指令 调度 器 )，595 
instruction scheduling ( 指令 调度 )，19-21，522，585- 

618 

constraining (指令 调度 的 限制 )，21 

defined (指令 调度 的 定义 )，21，545，586 

dependences (指令 调度 的 相关 性 )，522 

as difficult problem ( 作为 困难 问题 的 指令 调度 )，21 

difficulty (指令 调度 的 困难 )，593 

fundamental operation (指令 调度 基本 操作 )，593 


instruction selection and (44 SEZ M484 iB EE), 
549 


local (局 部 指令 调度 )，593 
problem (指令 调度 问题 )，587-594 
quality measures (指令 调度 的 质量 度量 )，593 
regional (区 域 指令 调度 )，605-613 
register allocation and (寄存 器 分 配 和 指令 调度 ) ， 
594 
instruction selection (#§4- fÆ), 16-18, 545-584 
automatic construction (指令 筛选 的 自动 构造 )，550 
choices (指令 筛选 的 选择 ) 18 
CISC and (CISC 和 指令 调度 )，579 
complexity (指令 调度 的 复杂 性 )，546 
defined (指令 调度 的 定义 )，545 
peephole-based (基于 罕 孔 的 指令 调度 )，551，558 ， 
569-580 
register allocation and (寄存 器 分 配 和 指令 调度 )， 
549 
RISC and (RISC 和 指令 调度 ) 579 
scheduling and (调度 和 指令 调度 ) 549 
tree-walk scheme (指令 调度 的 树 遍历 方案 )，552- 
558 
via tree-pattern matching (通过 树 模式 匹配 的 指令 调 
度 )，558-569 
instruction sequences (指令 序列 ) 
generating (指令 序列 生成 )，581-582 
search for (指令 序列 搜索 )，581 
synthesizing (指令 序列 合成 )，582 
instruction set architecture (ISA) (指令 集体 系 结构 )， 
545 
complex〈 复 杂 的 指令 集体 系 结构 )，571 
constraints (指令 集体 系 结构 的 限制 )，547 
target (目标 指令 集体 系 结构 )，579 
instruction-cache misses ( 指令 缓冲 失误 )，539-540 
instruction-level parallelism (ILP) (指令 级 并 行 )，588 
exhausted (指令 级 并 行 耗 尽 }，599 





memory latency and (内 存 等 待 时 间 和 指令 级 并 行 )， 
588 
instructions (指令 ) 
idle (空闲 指令 )，332 . 
ILOC program (ILOC 程 序 指令 ) 660 
operations and 〈 操 作 和 指令 ) 588-589 
per second (每 秒 指令 数 )，615 
sequential list of (指令 的 顺序 表 )，660 
integers (整数 ) 
assignment (整数 赋值 ) 168 
length of (整数 长 度 )，161 
pointer to (指向 整数 的 指针 )，165 
signed ( 带 符号 整数 ) 35 
storage-efficient representations (整数 的 高 效 存 储 表 
I), 66 
two-dimensional array of ( 整数 的 二 维 数组 )，162 
unsigned (无 符号 整数 ) 34, 37, 39 
interference graphs (冲突 图 ) 639-641, 684 
2-colorable (2 着 色 冲 突 图 ) 640 
adjacency vectors and (邻接 向 量 和 )，684 
as basis for coalescing (作为 接合 基础 的 冲突 图 )，651 
breaking, into smaller pieces (把 冲突 图 切割 成 小 冲 
突 图 )，652 
building (冲突 图 的 构建 ) 640-641 
construction illustration (结构 图 解 冲突 图 )，640 
defined (冲突 图 的 定义 )，639 
imprecise ( 非 精 确 冲 突 图 )，651-652 
machine constraint encoding in ( 促 突 图 中 的 机 器 限制 
编码 )，649-651 
size/sparsity of (冲突 图 的 大 小 /稀疏 性 ) 700-701 
interference-region spilling (冲突 区 域 溢出 )，653 
interference (s) (bR), 639-641 
defined (冲突 的 定义 )，640，641 
live ranges and (存活 范围 域 和 冲突 )，639 
intermediate representations (IRs) (中 间 表 示 )，5，6， 
209-250 
in actual use 〈 真实 使 用 中 的 中 间 表 示 )，226 
augmentation (配置 中 间 表 示 )，209 
builder (IR 构 建 器 )，239 
choice of (IR 的 选择 )，231，249 
data space requirements (IR 对 数据 空间 的 需求 )，212 
defined (IR 的 定义 )，209 
designing 《IR 的 设计 )，210 
expressiveness (IR 的 表示 能 力 )，212-213 
generation/manipulation cost (生成 /处 理 开 的 代价 )， 
212 
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graphical (PA7KIR), 210, 213-222, 679-684 
hybrid (AWIR), 211 
implementing (IR), 210, 679-686 
linear (2HEIR), 211, 222-228 
low-level ({RŻRIR), 233, 571-572 
operation deletion from (从 IR 中 消除 操作 )，493 
selecting (选择 IR)，210 
static single-assignment form (SSA) (IR 的 静态 单一 赋 
值 形式 )，228-231 
structural organization (IR 的 结构 化 组 织 )，210-213 
tree-based (基于 树 的 IR )，212 
interpreters (解释 器 ) 
compilers vs. (编译 器 和 解释 器 )，2-3 
defined (解释 的 定义 )，2 
uses (使 用 解释 器 )，2 
interprocedural analysis (过 程 间 分 析 )，362，434，483- 
488 
constant propagation (过 程 间 分 析 的 常量 传播 )，485- 
. 486 
control-flow analysis (过 程 间 分 析 的 控制 分 析 )，484 
inlining alternative (过 程 问 分 析 的 内 联 选择 ) 487 
pointer analysis 〈 过 程 间 分 析 的 指针 分 析 )，486 
recompilation (过 程 间 分 析 的 重 编译 )，487-488 
summary problems (过 程 间 分 析 的 概括 问题 ) 484- 
485 
interprocedural constant propagation (过 程 间 的 常量 传 
播 )，485-486 
interprocedural methods (过 程 间 方法 )，407-408，409 
irreducibility (不 可 约 性 )，481 
irreducible graphs (不 可 约 图 ) 
defined (不 可 约 图 的 定义 )，480 
recursive-descent parser (不 可 约 图 的 递归 下 降 语 法 分 
析 器 )，483 . 
reduction sequences 〈 不 可 约 图 的 归 约 序列 ) 482 
transforming (不 可 约 图 的 转换 )，481-482 
iterated coalescing (迭代 接合 )，652 
iterative data-flow analysis (迭代 数据 流 分 析 )，435-454 
limitations (迭代 数据 流 分 析 的 限制 )，447-450 
live variables (迭代 数据 流 分 析 中 的 医 变量 ) 435-444 
LiveOUT solver properties (迭代 数据 流 分 析 的 
LiveOUT 解 算 器 的 性 质 )，444-447 
See also data-flow analysis 


iterative live analysis (迭代 活 的 分 析 )，441 
J 


Java, scoping rules (Java 作 用 域 规则 )，261-262 
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jump (Bk) 
functions ( 跳 转 函数 ) 485 
table implementation ( 跳 转 表 实 现 ) 368 
targets (Wkk AFR), 440 


K 


keywords (关键 字 ) 

handling (处 理 关 键 字 )，65 

as identifiers (作为 标识 符 }，65 

regular expression (关键 字 的 正则 表达 式 )，37 
Kleene closure (Kleene 闭 包 ),37, 38, 44 


L 


LALR(1) construction (LALR(1) 结 构 )，147 
languages (语言 ) l 
comments (语言 注释 )，40 
data types (语言 的 数据 类 型 )，151 
declaration-free (无 声明 语言 )，203 
defined (语言 的 定义 )，37 
defined by context-free grammars (由 上 下 文 无 关 文 法 
定义 的 语言 ) 75 
dynamically checked (动态 检查 语言 )，169 
dynamically typed (动态 类 型 语言 )，156，169 
microsyntax (语言 的 微 语法 )，28 
name spaces (语言 的 名 字 空 间 )，260 
natural languages vs. (自然 语言 和 语言 )，43 
object-oriented (面向 对 象 语言 )，157 
regular (正则 语言 )，42 
regular expressions in (语言 中 的 正则 表达 式 )，36 
scoping rules (语言 的 作用 域 规则 )，259-262 
statically checked (静态 检查 语言 ) 169 
statically typed (静态 类 型 语言 )，156，169 
strongly typed ( 强 类 型 语言 ),，156,，159 
untyped (无 类 型 语言 )}，156，159 
weakly typed ( 弱 类 型 语言 )，156 
words in (语言 中 的 字 ),，43 
last-in，first-out(LIFO) discipline (后 进 先 出 规则 )，265 
latencies (等 待 时 间 ) 
hiding (隐藏 等 待 时 间 )，497，587 
load ( 装 入 等 待 时 间 )，610 
memory (内 存 等 待 时 间 )，588，637 
mutt operational (mu1t 操 作 等 待 时 间 )，588 
operational (操作 等 待 时 间 )，590 
later placements ( 较 晚 放置 )，506，511-512 
defined ( 较 晚 放 置 定义 )，511-512 


equations ( 较 晚 放置 方程 )，512 


See also anticipable expressions;earliest placement 
lazy code motion (LCM) ( 情 性 代码 移动 )，506-514 


anticipable expressions 〈 情 性 代码 移动 的 可 前 置 表达 


式 )，509-514 


available expressions ( 情 性 代码 移动 的 可 用 表达 式 )， 


508-509 
background 〈 情 性 代码 移动 背景 ) 507-508 
defined ( 情 性 代码 移动 的 定义 )，505，506 
DELETE set ( 情 性 代码 移动 DELETE 集 合 )，513 
equations (惰性 代码 移动 的 方程 )，508 
example ( 情 性 代码 移动 的 示例 )，509，514 


expression movement ( 情 性 代码 移动 的 表达 式 移动 )， 


508 


INSERT set (惰性 代码 移动 的 INSERT 集 合 ) 512- 
513 


local information (惰性 代码 移动 的 装 入 信息 )，507- 


508 


rewriting code (惰性 代码 移动 的 代码 重 写 )，512-514 


See also code motion 
leaders (448), 439 
leaf procedures (Hf), 372-373 


least-recently-used (LRU) replacement (最 近 最 少 使 用 置 


换 )，294 
left associativity ( 左 结合 性 )，139，140 
left recursion ( 左 递归 ) 
associativity ( 左 递归 的 结合 性 ) 139-140 
eliminating ( 左 递 归 消 除 )，94-96 
general, removal of (一 般 左 递归 消除 )，96 
immediate (立即 左 递 归 )，95 
indirect ( 间接 左 递归 )，95，96 
productions〈 左 递归 产生 式 )，92 
right recursion vs. ( 右 递 归 和 左 递归 )，138-140 
stack depth ( 左 递 归 的 栈 深 度 )，138-139 
termination problems ( 左 递归 的 终止 问题 ) 94 
See also recursion 
left-factoring ( 左 因子 分 解 )，101 
left-linear grammars ( 左 线 性 文法 )，87 
left-recursion grammars ( 左 递 归 文 法 )，92 
eliminating ( 左 递 归 文 法 消除 )，94-96 
left associativity ( 左 递 归 文 法 的 左 结 合 性 )，204 


termination problems and (终止 问题 和 左 递归 文法 )， 


94 
1ex scanner generator ( 1]ex 扫 描 器 生成 器 ) 61 
lexical scopes (词法 作用 域 ) 
adding (增加 词法 作用 域 ) 694-698 
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example ( 词法 作用 域 的 示例 )，243 
to open addressing 《开放 寻找 的 词法 作用 域 )，696- 
698 
to open hashing (开放 散 列 的 词法 作用 域 ) 695-696 
See also scopes 
linear IRs (线性 IR ) 222-228, 684-686 
data structures (28 HEIR MIB Hes Hy), 225-228 
defined (线性 IR 的 定义 )，211 
as definitive representation (作为 确定 性 表示 的 线性 
IR), 223 
implementing (线性 IR 的 实现 )，225-228 
logic (逻辑 线性 IR)，223 
ordering (线性 IR 排 序 )，223 
stack-machine code ( 栈 机 器 代码 的 线性 IR ) 223, 
224 
three-address code (三 地 址 代码 的 线性 IR )，223， 
224-225 
See also intermediate representations(IRs), 
linear lists (线性 列表 )，687 
linear representations (线性 表示 )，225-228 
linear search (线性 搜索 )， 365 
linear-function test replacement(LFTR) (线性 函数 测试 替 
换 )，537-538 
after (LFTR 之 后 )，538 
defined (LFTR 的 定义 )，537 
edge labels (LFTR 的 边 标 签 )，537 
features (LFTR 的 性 质 )，538 
performing (LFTR 的 执行 )，537 
linkages ( 链接) 
building (构建 链接 )，287-288 
convention (链接 约定 )，286 
illustrated (图 解 链接 )，287 
negotiation (链接 协商 )，289 
standardized (标准 的 链接 )，286-290 
link-time optimizers (链接 时 优化 器 )，488 
LINPACK (LINPACK) 
defined (LINPACK 的 定义 )，385 
dmxpy (dmxpy LINPACK), 387 
list of structures (结构 列表 )，685-686 
list representation (列表 表示 )，675-677 
list scheduling (列表 调度 )，595-605 
adaptation (列表 调度 的 适应 性 ) 595 
algorithm (列表 调度 算法 )，596，603 
backward (向 后 列表 调度 )，60-603 
as basis (作为 基础 的 列表 调度 )，605 
classic (典型 的 列表 调度 )，595 


defined (列表 调度 的 定义 )，593，595 
efficiency (列表 调度 的 效率 )，598-599，604 
execution time (列表 调度 的 执行 时 间 )，601 
forward (向 前 列表 调度 ) 600-603 
greedy heuristic 〈 列 表 调 度 的 俩 禁 启 发 式 搜索 ) 603 
local ( 局 部 列表 调度 ) 599 
reasons to use (列表 调度 的 使 用 理由 ) 603-605 
from roots to leaves (从 根 到 叶 的 列表 调度 ) 600 
variations (列表 调度 的 变形 )，617 
live range splitting (分 离 存活 范围 )，643，653-654 
passive (被 动 存活 范围 的 分 离 )，653-654 
zero-cost (存活 范围 的 零 代价 分 离 )，653 
live ranges (存活 范围 )，630-631 
in basic block (基本 块 中 的 存活 范围 )，631 
building, from SSA form (从 存活 范围 构建 SSA 形 式 )， 
636 
coalescing (存活 范围 的 接合 )，646-647 
complex (复杂 存活 范围 )，634 
defined (存活 范围 定义 )，630 
discovering (存活 范围 的 发 现 )，636 
finding (寻找 存活 范围 )，631，634 
global (全 局 存活 范围 )，635-637 
in global allocator (全 局 分 配 中 的 存活 范围 )，633-634 
interference and ( 神 突 与 存活 范围 )，639 
ordering in bottom-up coloring (存活 范围 的 自 底 向 上 
着 色 的 排序 ) 644 
partial , spilling (分 离 部 分 存活 范围 ) 653 
set of (存活 范围 的 集合 )，630 
specific placement, of (存活 范围 的 特定 放置 )，650- 
651 
spilling and (溢出 和 存活 范围 ) 641 
live variables ( 活 变 量 )，435-444 
as backward problem (作为 向 后 问题 的 活 变量 )，438 
CFG (CFG 中 的 活 变 量 )，439-441 
defined ( 活 变 量 的 定义 )，435 
equations for〔( 活 变量 的 方程 )，437-438 
in global register allocation ( 爹 局 寄存 器 分 配 中 的 活 
MH), 436 
in SSA construction (SSA 结 构 中 的 活 变 量 )，436 
uses (使 用 活 变量 )，435-437 
See also variables 
LiveIN (LiveIN), 631 
liveness (t£), 630 
LiveNOW (LiveNOW), 640 
LiveOUT (LiveOQUT), 631 
AVAILvs. (LiveOUT#IAVAIL), 438-439 
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correctness (LiveOUTHJIE WATE), 445 
dominance for (LiveOUT 的 支配 关系 )，458 
efficiency (LiveOUT 效 率 )，445-447 
equations (LiveOUT 方 程 )，437 
example computation (LiveOUT 示 例 计 算 )，442 
properties (LiveOUT 性 质 )，444-447 
round-robin postorder solver for (LiveOUT 的 round- 
robin 后 序 解 算 器 )，446 
sets, computing (LiveOUT 的 集合 计算 ) 438 
solving equations for (LiveOUT 方 程 求解 ) 443-444 
termination (LiveOUT 的 终止 性 ) 444-445 
LL(1) grammars (LL(1) Xk), 88, 102 
defined (LL(1) 文法 的 定义 ) 104 
usefulness (LL(1) 文法 的 有 效 性 )，106 
LL(1) parsers (LL(1) 语法 分 析 器 )，104 
building table for (LL(1) 语法 分 析 器 表 的 构建 )，105 
skeleton (LL(1) 语 法 分 析 器 的 框架 )，106 
table-driven (LL(1) 语法 分 析 器 的 表 驱 动 )，134 
load address-immediate instruction ( 装 和 地址 立即 指令 )， 
317-318 
load latencies ( 装 人 等 待 时 间 )，610 
load operation (10ad 操 作 )，346，347，529，665 
load tracking (32 ARREZ), 193-195 
with ad hoc syntax-directed translation 〈( 带 有 专用 语 
法 制导 翻 详 的 装 入 跟踪 ) 193-195 
copy rules for ( 装 人 跟踪 的 拷贝 规则 )，183 
rules for ( 装 入 跟踪 的 规则 )，182 
loadAI operation (10adAI 哥 作 )，317，318，564，664 
1oadA0 operation (1oadA0 操 作 )，664 
1oadI operation (10adI 操 作 )，317，318，330 
local analysis，434 
local methods ( 局 部 方法 ) 404-405 
defined (局 部 方法 的 定义 ) 624 
join points (局 部 方法 的 连接 点 ) 425 
local register allocation ( 局 部 寄存 器 分 配 ) 624-629 
bottom-up 〈 自 底 向 上 局 部 寄存 器 分 配 ) 626-629 
global allocation vs. (全 局 分 配 与 局 部 寄存 器 分 配 )， 
633-634 
optimal (优化 的 局 部 寄存 器 分 配 )，628 
top-down 〈 自 项 向 下 局 部 寄存 器 分 配 )，625 
See also register allocation . 
local value numbering (LVN) (局 部 值 编 号 )，474 
local variables ( 局 部 变量 )，264 
initializing (初始 化 局 部 变量 )，264-265 
of other procedures 〈( 其 他 过 程 的 局 部 变量 ) 281-285 


See also variables 


logical windows (逻辑 窗口 ) 577-578 
lookup(s) (查找 ) 
dynamic method ( 动态 方法 寻找 )，377 
failure (查找 失败 ) 399-400 
processes (查找 处 理 )，248 
loop scheduling (循环 调度 ) 608-612 
benefit (利益 )，608 
code reordering and (代码 重 排序 的 循环 调度 )，611 
for one functional unit (一 个 功能 单元 的 循环 调度 )， 
609 
pipelined loop (管道 循环 ) 608-612 
techniques (循环 调度 技术 ) 608. 
loop unrolling (循环 展开 )，519-520 
defined (循环 展开 的 定义 )，519 
illustrated ( 图解 循 环 展开 )，519 
key effects (循环 展开 的 关键 效应 ) ，520 
operation reduction (循环 调度 减少 操作 ) ，520 
unknown bounds and (未 知 边 界 和 循环 展开 )，520 
See also enabling transformations 
loop unswitching (循环 反切 换 )，520-521 
defined (循环 反切 换 的 定义 )，520 
effects (循环 反切 换 的 效应 )，521 
illustrated (图 解 循 环 反 切换 )，521 
See also enabling transformations 
loop-based methods (基于 循环 的 方法 ) 407 
loop-carried data dependence (循环 进位 数据 相关 )，520 
loops (循环 )，359-364 
bounds, unknown (循环 未 知 边界 ) 520 
character-by-character (字符 到 字符 的 循环 ) 348 
do (do 循环 )，361-362 
empty, removing (消除 空 循环 )}，504 
epilogue (循环 的 结语 )，609 
for (forf), 359, 360-361 
header block (循环 的 头 部 块 )，633 
iterations, order (循环 的 迭代 顺序 ) 497 
iterations, total number of (循环 的 迭代 总 量 )，390 
nest (REM), 387-388, 389, 497 
pipelined (流水 线 循环 ) 608-612 
prologue (循环 的 序言 )，608，611 
scheduling (循环 调度 ) 608-612 
structure addresses in (循环 中 的 结构 地 址 )，528 
unrolled (展开 的 循环 )，388 
unrolled inner (展开 的 内 部 循环 )，391 
unrolling (循环 展开 )，519-520 
unswitching (循环 的 反切 换 )，520-521 
until (unti1 循 环 )，363 
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while (whilef@h), 34, 52, 54, 59, 302 
word-oriented (面向 字 的 循环 )，347 
lost-copy problem (无 效 拷贝 问题 )，476-478 
arising of (无 效 拷贝 问题 引发 的 ) 477 
avoiding (回避 无 效 拷贝 问题 ) 478 
defined (无 效 拷贝 问题 的 定义 )，475 
example illustration (无 效 拷贝 问题 的 示例 图 解 )，477 
low-cost matches( 低 代价 匹配 )，567-568 
lower-level IR(LLIR) (低级 IR) 
front-end generation of (LLIR 的 前 端 生 成 )，578 
operation overhead (LLIR 的 操作 人 负担 )，580 
Operations (LLIR 操 作 )，571 
sequences (LLIR 序 列 )，578，579 
simplified, comparison (化 简 了 的 LLIR 比 较 )，572 
See also intermediate representations (IR) 
low-level trees (低级 树 )}，218 
LR(1) grammars (LR(1) 文法 )，88 
LR(1) items (LR(1) 4A), 120, 121-122 
canonical collection of sets for (LR(1) 项 目的 规范 集 
ey), 122-127 
defined (LR(1) 项 目的 定义 ) 121 
example (LRO) 项 目的 示例 )，122 
finite (有 穷 LR(1) 项 目 )，123 
left context (LR(1) 项 目的 左上 下 文 )，122 
position (LR(1) 项 目的 位 置 )，121-122 
right context (LR(1) 项 目的 右上 下 文 )，122 
LR(1) parsers (LR(1) 语法 分 析 器 ) ，74，115-120 
build key (构建 LR(1) 语法 分 析 器 的 关键 )，119 
construction algorithm (LR(1) 语法 分 析 器 的 结构 算 
法 )，114 . 
defined (LR(1) 语法 分 析 器 的 定义 )，108 
driver (LR(1) 语法 分 析 器 的 驱动 器 )，116 
generator system structure (LR(1) 语法 分 析 器 的 生成 
器 系统 结构 )，115 
LALR(1)(LR(1) 语法 分 析 器 的 LALR(1) 语法 分 析 器 )， 
115 
one-symbol lookahead and (LR(1) 语法 分 析 器 与 向 前 
看 一 个 符号 )，114 
properties (LR(1) 语法 分 析 器 的 性 质 ) 108 
resynchronization (LR(1) 语法 分 析 器 中 的 重新 同步 )， 
134 l 
-rightmost derivation (LR(1) 语法 分 析 器 的 最 右派 生 )， 
108 
SLR(1) (LR(1) 语法 分 析 器 的 SLR(1) 分 析 器 )，115 
states (LR(1) 语法 分 析 器 的 状态 )，120 
table-driven (LR(1) 语法 分 析 器 的 表 驱 动 )，134 
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See also bottom-up parsing 


LR(1) tables (LR(1) ##%), 120-133 


Action (LR(1) 表格 中 的 Action)，116，117，118 

building (LR(1) 表格 构建 )， 120-133 . 

canonical collection construction (LR(1) 表格 的 规范 
集合 构造 )，122-127 

construction (LR(1) 表格 构造 )，116 

construction algorithm (LR(1) 表格 构造 算法 )，116 

construction errors (LR(1) 表格 构造 错误 ) 129-133 

construction trace (LR(1) 表格 构造 轨迹 )，126，130 

directly encoding (LR(1) 表格 的 直接 编码 )，145-146 

filling in (LR(1) 表格 的 填充 )，127-128 

Goto (LR(1) 表格 中 的 Goto)，116，117，119 

LR(1) items (LR(1) 表格 中 的 LR(1) 项 目 )，121-122 

for reduced expression grammar (缩小 的 表达 式 文法 
的 LR(1) 表格 )，146 

rows/columns, combining (LR(1) 表格 的 行 或 列 的 合 
并 )，144 

size approximation (LR(1) 表格 大 小 的 近似 )，147 

size reduction (LR(1) 表格 大 小 的 减 小 ) 143-147 

See also LR(1) parsers 


M 


machine idiosyncrasies (机 器 特性 )，312-313 | 
machine-dependent transformations (机 器 相关 转换 ) 


496-497 

bounded machine resource management (机 器 相关 转 
换 的 有 限 机 器 资源 的 管理 ) 497 

defined (机 器 相关 转换 的 定义 ) ，494 

hardware features and (硬件 特性 和 机 器 相关 转换 )， 
496-497 

illustrated (机 器 相关 转换 的 说 明 )，497 

latency hiding (机 器 相关 转换 的 等 待 时 间 的 隐藏 )， 
497 


See also transformations 


machine-independent transformations (机 器 无 关 转 换 )， 


494-496 

computation specialization (机 器 无 关 转 换 的 计算 特 
化 )，495-496 

defined (机 器 无 关 转 换 的 定义 )，494 

illustrated (机 器 无 关 转 换 的 图 解 )，495 

operation movement 《机 器 无 关 转换 的 操作 移动 )，495 

redundant computation elimination (机 器 无 关 转 换 的 
元 余 计算 的 消除 )，496 

transformation enablement (机 器 无 关 转 换 的 转换 激 
话 )，496 





474 


€ i 





useless/unreachable code elimination (机 器 无 关 转 换 
的 无 用 /不 可 达 代码 的 消除 )，495，498-505 
See also transformations 
marking algorithm (标记 算法 )，302-303 
conservative (保守 的 标记 算法 )， 302-303 
illustrated ( 图解 标记 算法 ) 302 
precise (精确 的 标记 算法 ) 302 
mark-sweep collectors (标记 清理 回收 器 )，301， 303 
defined (标记 清理 回收 器 的 定义 )，303 
technique comparison (标记 清理 回收 器 的 技术 比较 )， 
304 
matches (匹配 ) 
code sequences for (匹配 的 代码 序列 )，564 
low-cost, finding (匹配 的 低 代价 寻找 )，567-568 
precomputing (匹配 的 预计 算 )，567 
See also tree-pattern matching 
maximal SSA form ( 极 大 SSA 形 式 )，457 
may modify problem ( 可 能 修改 问题 )，484-485 
defined ( 可 能 修改 问题 的 定义 )，484 
equations ( 可 能 修改 问题 的 方程 )，485 
may reference sets (可 能 修改 问题 中 的 可 能 引用 和 集 
合 )，485 
meaning (意义 ) 
checking (意义 检查 )，12 
defined (意义 的 定义 )，8，389 
syntax vs. (语法 与 意义 )，153 
meet-over-all-paths solution (所 有 路 径 相 遇 解 )，445 
memory (内 存 ) 
cache (内 存 缓冲 )，293-295 
latencies (内 存 等 待 时 间 ) ，637 
` layout (内 存 布局 ) 290-295 
logical address-space layout (内 存 逻 辑 地 址 空间 布 
局 )，291 
managing (内 存 管理 ) ，290-305 
multiregister operations (内 存 多 寄存 器 操作 )，371 
registers vs. (寄存 器 和 内 存 )，621 
vector, layout (内 存 的 向 量 布局 )，333 
memory models (内 存 模型 )，235-238 
choice of (内 存 模 型 的 选择 )， 236, 621 
impact on code shape (内 存 模 型 对 代码 形态 的 影响 )， 
292-293 < 
memory-to-memory (内 存 到 内 存 的 内 存 模型 )，236， 
292 
register-to-register (寄存 器 到 寄存 器 的 内 存 模 型 )， 
235-236, 292-293 


memory operations ( 内存 操 作 ) 664-665 
delays ( 内存 操作 等 待 )，599 
executing (内 存 操 作 的 执行 )，599 
hierarchy (内 存 操作 层次 )，237 
multiword (多 字 内 存 操作 )，551 
sequence (内 存 操作 序列 )，628 
speed (内 存 操 作 的 速度 )，547 
memory-to-memory model (内 存 到 内 存 模 型 )，236， 
292 
code shape and (代码 形态 和 内 存 到 内 存 模型 )，292 
register allocator in (内 存 到 内 存 模型 的 寄存 器 分 配 
器 )，621 
values in memory (内 存 中 的 内 存 到 内 存 模型 的 值 )， 
621 
See also memory models 
methods (方法 ) 
defined (方法 的 定义 ) 270 
finding, in superclass hierarchy (在 超 类 层次 中 寻找 
方法 )，272 
lookups (方法 查找 )，272-273，377 
mapping names to (名 字 到 方法 的 映射 ) 272-274 
tables (方法 表格 )，378 
microsyntax ( 微 语法 ) 
in context-free grammars (上 下 文 无 关 文 法 中 的 微 语 
法 )，89 
defined ( 微 语法 的 定义 )，28 
syntax separation from (语法 与 微 语法 的 分 离 )，38- 
39 ` 
minimal SSA ( 极 小 SSA )，468 
mixed-type expressions (混合 类 型 表达 式 )，320 
MSCP compiler (MSCP 编 译 器 )，663 
multI operation (multI 操 作 )，529 
multipass compilers (多 遍 编 译 器 )，228 


multiple inheritance ( 多重 继承 )，378-379 


complication (多 重 继承 的 复杂 性 )，379 
with trampoline function ( 带 有 蹦床 函数 的 多 重 继承 )， 
379-380 

See also inheritance 
multiplicative hash functions (乘法 散 列 函 数 ) 688 
multipool allocators (多 池 分 配器 )，298-299 

alternate schemes (多 池 分 配器 的 可 选择 方案 )，299 

defined (多 池 分 配器 的 定义 )，298 

memory pools (多 池 分 配器 的 内 存 地 )，298 
multiregister values (多 寄存 器 值 ) 649-650 
multiset discrimination (多 重 集 判 别 )，241 
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defined (多 重 集 判 别 的 定义 ) 687 
using (多 重 集 判别 的 使 用 ) 241 


N 


name equivalence (名 字 等 价 ) 166, 167 
name resolution ( 名 字 分 解 ) 
defined (名 字 分 解 的 定义 ) 243 
linked tables for (名 字 分 解 的 链接 表格 ) 248 
name spaces (名字 空 间 )，252-253 256-275 
activation records (名 字 空 间 的 活动 记录 )，262-267 
in Algol-like languages (类 Algol 语 言 中 的 名 字 空间 )， 
257-259 
defined ( 名字 空间 的 定义 )，252 
in languages (各 语言 中 的 名 字 空 间 )，260 
of object-oriented languages (面向 对 象 语言 的 名 字 空 
间 )，268-275 
SSA (SSA 名 字 空 间 )，474,475 
named values (命名 值 )，309 
names (名字 ) 
compiler generation of (名 字 的 编译 器 生成 )，232 
declaring, at multiple levels (多 层次 的 名 字 声 明 )， 
242 
expression (表达 式 的 名 字 )，419 
full qualified (完整 限定 名 字 )})，374 
impact of (名字 的 影响 )，234-235 
inheritance ( 名字 继 承 )，256 
level lifetime (名 字 的 层次 生存 期 )，242 
mapping, to methods ( 名 字 到 方法 映射 ) 272-274 
mapping values to ( 值 到 名 字 映 射 )，231-238 
name space management ( 名字 空间 的 管理 )，247 
register, arbitrary (任意 寄存 器 名 字 )，564 
reusing (名 字 复 用 )，231 
set, in data-flow equations (控制 流 方程 中 的 名 字 集 
合 )，449 
SSA (SSAZ#), 454, 455 
static coordinate for (名 字 的 静态 坐标 ) 259 
temporary value (名 字 的 临时 值 ) 233-235 
translations and (翻译 和 名 字 )，232 
value numbering and ( 值 编 号 和 名 字 )，402-403 
visibility rules ( 名字 可 视 性 规则 )，274-275S 
natural languages ( 自然 语言 ) 43 
nested scopes (EHAR) 
handling (EPAR), 242-246 
lexical (AREH), 257-259 
managing (AER HE), 244 


in Pascal (Pascal 中 的 嵌 套 作用 域 ) 258 
See also scopes 
nodes ( 结 点 ) 
AST (AST 结 点 )，216，394 
attribute association with (与 结 点 相关 的 属性 )，191 
custom-allocating ( 结 点 定制 分 配 )，682 
DAG (DAG 结 点 )，217，394 
hard-to-color ( 难 着 色 结 点 )，649 
long-latency ( 结 点 的 长 等 待 时 间 )，600 
with no predecessors (没有 前 驱 的 结 点 )，589 
rank ( 结 点 等 级 )，600 
root (RA), 589 
sequence 〈 结 点 序列 ) 142 
splitting ( 结 点 分 离 )，483 
systematic bias towards ( 结 点 的 系统 倾向 )，600 
nondeterministic (NFAs) ( 非 确 定性 有 穷 自动 机 )，44， 
45-50 
acceptance criteria (NFA) (NFA 的 可 接受 标准 )，47 
behavior simulation (NFA 的 行为 模拟 )，47 
configuration (NFA 的 格局 )，47 
defined (NFA 的 定义 ), 46 
deriving, from regular expression ( 从 正则 表达 式 得 
到 NFA), 48 
equivalent DFA (与 DFA 等 价 的 NEA ) 47 
nondeterministic choices (NFA 的 非 确 定性 选择 ) 46 
state (NFA 的 状态 )，47 
states ，transition for (NFA 的 状态 转换 )，52 
trivial, for RE operators (对 应 于 RE 操作 符 的 平凡 
NFA), 48 
See also finite automata (FA) 
noniterative data-flow algorithms ( 韭 迭 代数 据 流 算法 )， 
479, 480 
nonrecursive program ( 非 递 归程 序 )，255 
nonterminal symbols ( 非 终 结 符 )，76 
arbitrary order of ( 非 终 结 符 的 任意 顺序 )，96 
defined ( 非 终结 符 的 定义 )，75 
leftmost, expansion ( 非 终 结 符 的 最 左 展开 )，80 
operation trees and (操作 树 和 非 终 结 符 )，563 
rewrite rules ( 非 终结 符 的 重 写 规则 )，560 
set of ( 非 终结 符 的 集合 )，78 
null-terminated strings ( 空 终结 串 )，346，349 
number systems ( 数 制 )，321-322 
numbers ( 数 ) 
as base types (作为 基本 类 型 的 数 ) 160-161 
floating-point (浮动 点 数 )，160 
real (实数 )，39，40 
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numerical encoding ( 数 编码 ) 324-325 


O 


object records (Xt Rid R), 270, 375 
defined (对 象 记录 定义 )，270 
laying out (对 象 记录 布局 )，377-378 
object-oriented languages (面向 对 象 语言 )，157 
Algol-like languages vs. (类 Algol 语 言 和 面向 对 象 语 
言 )，274-275 
code reuse (面向 对 象 语言 的 代码 复 用 )，269 
defined (面向 对 象 语言 的 定义 )，268 
implementing (面向 对 象 语言 的 实现 )，373-381 
inheritance (面向 对 象 语言 的 继承 性 )，271-272 
namé spaces of (面向 对 象 语言 的 名 字 空 间 )，268- 
275 
single class, no inheritance ( 非 继承 面向 对 象 语言 的 
单一 类 )，373-375 
single inheritance (单一 继承 面向 对 象 语言 )，375- 
377 
terminology (面向 对 象 语言 的 术语 )，270-271 
objects (对 象 ) 268-270 
in classes (类 中 的 对 象 )，269 
defined (对 象 的 定义 ) 268 
instances 《对象 实 例 )，270 
layout (对 象 布 局 )，269 
as software-engineering strategy (作为 软件 工程 策略 
的 对 象 )，268 
observational equivalence ( 可 观察 等 价 ) 389 
opcodes (操作 码 )，660，661 
Open64 compiler (open64 编 译 器 ) 226 
-open addressing (开放 寻 址 )，691-693 
adding lexical scopes to (增加 开放 寻 址 的 词法 作用 
IR), 696-698 
defined (开放 寻 址 的 定义 )，686 
drawbacks (开放 寻 址 的 缺点 )，692 
symbol records and (符号 记录 和 开放 寻 址 )，693 
table 《开放 寻 址 表格 ) 692 
table size (开放 表格 大 小 )，693 
open hashing (开放 散 列 ) ，689-691 
adding lexical scopes to (增加 开放 散 列 的 词法 作用 
域 )，695-696 
advantages (开放 散 列 的 优点 )，690 
assumptions (开放 散 列 的 假设 )，689 
defined (开放 散 列 的 定义 )，686 
drawbacks (开放 散 列 的 缺点 ) 690-691 
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symbol records and (符号 记录 和 开放 散 列 )，693 
table (开放 散 列表 格 )，690 


”operands (操作 数 )，661 


operation scheduling (操作 调度 ) .See instruction 
scheduling 
operation trees (操作 树 )，559，563 
operations (操作 ) 
address-immediate (地 址 立即 操作 )，664 
address-offset (地 址 偏 移 操作 ) 664 
arguments (操作 参数 )，17 
arithmetic (算术 操作 )，662-663 
candidate (候选 操作 )，530 
commutative ( 可 交换 性 操作 )，、400 
conditional branch (条 件 分 支 操 作 )，668 
control-flow (控制 流 操作 )，576-577，667-670 
copy (拷贝 操作 )，403 
cost (操作 代价 )，547 
defined (操作 定义 )，587 
evaluation subtleties (评估 操作 中 的 微妙 问题 )，526- 
527 
“false” dependence on (操作 上 的 “ 假 ” 依 赖 )，21- 
22 
floating-point 《( 浮 点 操作 )，547 
ILOC (ILOC 操 作 )，660 
instructions and (指令 和 操作 )，588-589 
issuing, per cycle (每 周期 的 操作 发 行 )，589 
iteratively selecting (迭代 地 选择 操作 )，596 
jump ( 跳 转 操作 ) ，669-670 
LLIR (LLIR 操 作 )，571 
long-latency (操作 的 长 等 待 时 间 )，20 
memory (内 存 操 作 )，237，547，551，599，,，664-665 
moving (移动 操作 )，495 
moving，from precall/postreturn sequences (从 调用 
前 序列 /返回 后 序列 移动 操作 )，369 
multiple, at same time (同时 的 多 个 操作 )，597 
multiregister memory (多 个 寄存 器 内 存 操作 )，371 
operands (操作 的 操作 数 )，17 
overlapping (#A(F 264), 87 
predicated (谓词 操作 )，328 
priorities ，assigning (操作 优先 级 的 指定 )，595-596 
register-to-register (寄存 器 到 寄存 器 操作 )，579 
' register-to-register copy (寄存 器 到 寄存 器 拷贝 操作 ) ， 
665 
‘rewriting ( 重 写 操作 ) 526-527 
shift ( 移 位 操作 )，663-664 
string (RE), 344 
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three-address (三 地 址 操作 )，313 
three-address code (三 地 址 代码 操作 ) 224-225 
unreachable (不 可 达 操作 )，498 
variable-length (可 变 长 度 操 作 )，685 
See also specific operations 
operator(s)《 操 作 符 ) 
assignment as (作为 操作 符 的 赋值 )，321 
boolean (布尔 操作 符 )，322-333 
closure( 闭 包 操 作 符 )，37 
comparison 《比较 操作 符 ) 668-669 
overloading (操作 符 重 载 )，156 
relational (关系 操作 符 )，322-333 
strength reduction (强度 减弱 操作 符 )，384 
strength reduction algorithm (强度 减弱 算法 操作 符 )， 
533 
unary (一 元 操作 符 )，135-136，320 
whole-word (全 字 操 作 符 ) ，348 
optimistic algorithms (优化 算法 )，517 
optimization scope (优化 作用 域 ) 404-408 
global methods (全 局 方法 的 优化 作用 域 )，407 
interprocedural methods (过 程 闻 方法 的 优化 作用 域 )， 
407-408, 409 
intraprocedural methods ( 过 程 内 方法 的 优化 作用 域 )， 
407, 409 
larger, as act of faith (坚信 较 大 的 优化 作用 域 )， 
425 A 
local methods 〈 局 部 方法 的 优化 作用 域 ) 404-405 
regional methods (区 域 方法 优化 作用 域 ) 405-407 
superlocal methods 〈 超 局 部 方法 的 优化 作用 域 ) 405 
whole-program methods ( 整个 程序 方法 优化 作用 域 )， 
407-408 
See also code optimization;scopes 
optimization(s) (优化 )，7 
code (代码 优化 )，15，383-432 
combining (优化 组 合 )，523-527 
defined (优化 的 定义 )，16 
grammar (优化 文法 )，141-143 
interprocedural ( 过 程 间 优化 )，408 
leaf procedures ( 叶 过 程 优 化 )，372-373 
peephole ( 罕 孔 优化 )，515，551，569-580 
scalar (标量 优化 )，491-544 
short-circuit evaluation as (作为 优化 的 短路 评估 )， 
330 
as software engineering 《作为 软件 工程 的 优化 )，493 
optimizers (优化 器 )，492 
design 《优化 器 设计 )，492 
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interaction, increasing (增加 优化 器 间 的 相互 作用 )， 
581 
link-time (链接 时 优化 器 )，488 
pass-structured ( 遍 结 构 式 优化 器 )，493 
peephole ($2 4L(i{L# ), 552, 569, 570, 575, 580 
repeating passes (重复 遍 优 化 器 ) 492 
separate (分 离 优化 ) 493 
optimizing compilers 《优化 编译 器 ) 
debugging compilers vs. (调试 优化 器 和 优化 编译 器 )， 
386 
designing (优化 编译 器 的 设计 )，541 
ordered lists (有 序列 表 )，675-677 
OSR algorithm (0SR 算 法 ) 
defined (OSRH), 529 
header field (0SR 算 法 中 的 标题 字段 )，532 
induction variable definition (0SR 算 法 的 归纳 变量 定 
义 )，531 
Tarjan’s strongly connected region finder (0SR 算 法 中 
的 强 连通 区 域 探测 器) 532 
out-of-order execution (无 序 执行 )，604 
overloading ( 重 载 )，156 


padding (填充 )，293 
page faults, avoiding (避免 页 错误 )，539-540 
parameter(s) (参数 ) 
actual (实际 参数 )，275 
array-valued ( 数组 值 参 数 ), 341-343 
binding (参数 绑 定 ) 275 
call-by-name binding (名 字 引 用 绑 定 参数 )，277 
call-by-reference binding (引用 调用 绑 定 参数 ) 276- 
279，318，319 
call-by-value binding 〈 值 调用 绑 定 参数 ) 275-276 
evaluating (参数 评估 ) ，369-370 
expansion (参数 展开 ) ，70 
formal (形式 参数 ) 275 
passing (传递 参数 ) 275-279 
procedure-valued (过 程 值 参数 )，370 
values, accessing (参数 值 存 取 )，318-319 
parametric polymorphism (参数 多 态 性 ) 170 
parse trees (分 析 树 )，81，83，213-214 
attributed, evaluating (评估 属性 分 析 树 )，172 
with classic expression grammar ( 带 有 经 典 表 达 式 文 
法 的 分 析 树 )，214 | 
defined (分 析 树 定义 )，213 
derivation equivalent (分 析 树 的 派生 等 价 )，86 
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instantiating (分 析 树 实例 ) 186-187 
large 〈( 大 型 分 析 树 ) 141 
partial ( 部 分 分 析 树 )，109，111 
uses (分 析 树 使 用 )，213-214 
See also syntax-related trees 
parser generators (分 析 器 生成 器 ) 
automatic (自动 的 分 析 器 生成 器 )，133 
error-recovery routines (分 析 器 生成 器 的 错误 恢复 例 
程 )，134 
LALR(1) (LALR(1) 分 析 器 生成 器 )，190 
syntax-directed actions and (语法 制导 动作 和 分 析 器 
生成 器 )，190 
parsers (语法 分 析 器 ) 
asymptotic behavior (语法 分 析 器 的 渐 近 行为 )，141 
bottom-up (〈 自 底 向 上 语法 分 析 器 ) 86-87 
for classic expression grammar (经 典 表达 式 文 法 语法 
分 析 器 )，86 
engineering (语法 分 析 器 工程 )，140 
as engines (作为 工具 的 语法 分 析 器 )，74 
functioning of (语法 分 析 器 的 功能 )，86 
grammar (语法 分 析 器 中 的 文法 )，70 
LL(1) (LLC) 语法 分 析 器 ) 104, 105, 106 
LR(1) (LR(1) 语法 分 析 器 ) 74, 115-120 
number of words and (字数 和 语法 分 析 器 )，29 
output (语法 分 析 器 的 输出 )，86 
predictive (预测 语法 分 析 器 )，102 
responsibility (语法 分 析 器 的 责任 )，73 
size of (语法 分 析 器 的 大 小 )，28 
syntax errors and (语法 错误 和 语法 分 析 器 )，134 
table-driven (语法 分 析 器 的 表 驱 动 )，104 
top-down ( 自 顶 向 下 语法 分 析 器 )，86-87，89-106 
parsing (语法 分 析 )，73-149 
bottom-up ( 自 底 向 上 语法 分 析 )，74，107-120 
defined (语法 分 析 定 义 )，11，86 
difficulty (语法 分 析 的 困难 )，28 
goal (语法 分 析 的 目标 )，84 
LR(1) (LR(1) 语法 分 析 )，74 
recursive-descent (递归 下 降 语 法 分 析 )，74 
scanning and ( 扫描 和 语法 分 析 )，73 
shift-reduce ( 移 位 归 约 语法 分 析 )，108-112 
techniques 〈 语 法 分 析 技术 ) 74 
top-down ( 自 顶 向 下 语法 分 析 )，74，89-106 
partial parse trees (部 分 分 析 树 ) 109, 111 l 
partitions (划分 ) 
constructing DFA from (通过 划分 构建 DFA )， 58 
refining (划分 细 化 )，58 


splitting (分 离 划 分 )，57 
Pascal (Pascal 语 言 
nested procedures (Pascal 幅 套 过 程 )，257 
nested scopes in (Pascal Hk BEAR), 258 
nonrecursive program ( 非 递归 程序 ) 255 
passes (ig) . 
code uselessness and (代码 无 用 性 和 遍 ) ，492-493 ， 
499 
repeating (EG), 492 
validation (确认 遍 )，674 
passive splitting (被 动 分 割 )，653-654 
pass-structured optimizers ( 遍 结 构 式 优化 器 )，493 
pattern matching techniques (模式 匹配 技术 )，539 
pattern-driven optimization (模式 驱动 优化 )，571 
patterns (模式 ) 
peephole optimization ( HILARIA), 580-581 
priority specification (优先 级 描述 模式 )，61 
tree (ist), 558, 562, 563, 566 
PCC compiler (PCC 编 译 器 )，226 
peephole optimization (#§4LUt(L), 515, 551 
algebraic identities (代数 等 式 罕 孔 优化 )，570 
as competitive technology (作为 具有 竞争 力 技术 的 罕 
孔 优 化 )，578 
control-flow operations ( 罕 孔 优化 中 的 控制 流 操作 )， 
576-577 . 
dead values ( 罕 孔 优化 中 的 死亡 值 ) 575-576 
defined ( 罕 孔 优化 的 定义 )，569 
for instruction selection (#84 MAAIL), 558, 
569-580 
library of patterns (模式 库 中 的 窥 孔 优化 )，551 
logical windows 〈 罕 和 孔 优 化 中 的 膛 辑 窗口 ) 577-578 
patterns, learning〈 罕 孔 优 化 中 的 学 习 模 式 )，580-581 
physical windows ( 罕 孔 优化 中 的 物理 窗口 ) 577-578- 
window size〈 罕 孔 优 化 窗口 大 小 )，575 
peephole optimizers ( 窥 孔 优化 器 )，S52 
”construction automation ( 窥 孔 优化 器 的 自动 构建 )，569 
design issues ( 窥 孔 优 化 器 的 设计 问题 ) 575 
early (FRAILES), 570 . 
hand-coded patterns ( 罕 孔 优化 器 中 的 手工 代码 模式 )， 
570 l 
interaction, increasing ( 增加 罕 孔 优 器 间 的 相互 作用 )， 
581 
pattern-matching ( 罕 孔 优化 器 的 模式 匹配 )，580 
running 〈 罕 孔 优化 器 的 运行 )，570 
peephole transformers 〈 罕 孔 转换 器 ) ，578-580 
perfect hashing (完美 散 列 ) 65 
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performance (性 能 ) 
gap 《性 能 差异 )，386 
optimization improvement (优化 性 能 的 改进 ) 430 
run-time (运行 时 性 能 )，386，615 
pessimistic algorithms ( 悲观 算法 )，517 
PFC scanner (PFC 扫描 器 )，69 
pipelined loops (管道 化 循环 )，608-612 
algorithms (管道 化 循环 算法 )，612 
defined (管道 化 循环 的 定义 )，608 
source-loop iterations (管道 化 循环 的 源 循环 迭代 )， 
612 
value flow (管道 化 循环 的 值 流 )，612 
value flow illustration (管道 化 循环 的 值 流 说 明 )，613 
See also loop scheduling; loops 
PL8 compiler (PL8 编 译 器 )，226 
pointer analysis (指针 分 析 )，486 
complexity (指针 分 析 的 复杂 性 )，449 
motivation for (指针 分 析 的 动机 )，396 
POINTSTO sets (指针 分 析 的 POINTSTO 集 合 )，486 
pointer-based computations (基于 指针 的 计算 )，166 
pointers (指针 ) 
activation record (指针 活动 记录 )，17，262 
ambiguous (歧义 性 指针 )，396 
assignments (指针 的 赋值 ) 396-398 
to boolean (指向 布尔 的 指针 )，165 
current-level, changing (指针 当前 层次 的 改变 )，245 
defined (指针 的 定义 )，165 
dereferences (指针 的 解除 引用 )，320 
in indirection structure (间接 结构 中 的 指针 )，340 
to integer (指向 整数 的 指针 )，165 
list (指针 列表 )，686 
manipulation (指针 处 理 )，165 
null ( 空 指针 )，682 
schemes (指针 方法 )，680 
static analysis and (静态 分 析 和 指针 )，449 
storage-efficient representations (指针 的 高 效 存 储 表 
示 )，66 
type safety with (指针 类 型 的 安全 性 )，166 
values (指针 值 )，350，352 
POINTSTO sets (POINTSTO 集 合 )，486 
positional encoding (位 置 编码 )，325-327 
assignment and (赋值 和 位 置 编码 )，326 
benefits (位 置 编码 的 效益 )，327 
with. short-circuit evaluation (短路 评估 的 位 置 编码 )， 
326 
use of (位 置 编码 的 使 用 )，326，327 
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positive closure ( 正 闭 包 )，38 
postdominators (后 支配 者 )，501 
postreturn sequences (后 返回 序列 )，287 
defined (后 返回 序列 的 定义 )，287 
moving operations from (从 后 返回 序列 中 移动 操作 )， 
369 
powerset (Æ$), 47 
preallocation registers ( 预 分 配 寄 存 器 ) 624 
precall sequences (调用 前 序列 ) 286-287 
building (调用 前 序列 的 构建 )，369 
call-by-value parameters (调用 前 序列 中 的 值 调 用 参 
数 )，370 
defined 《调用 前 序列 的 定义 ) 286 
moving operations from (从 调用 前 序列 中 移动 操作 )， 
369 
precedence (优先 权 ) 
arithmetic (算术 优先 权 )，85 
closure ( 闭 包 的 优先 权 )，39 . 
graphs (优先 图 )，589 
levels of (优先 级 别 )，84 
nonterminal association with (与 优先 权 相 关 的 非 终 结 
F), 84 
precise collectors (精确 的 回收 器 ) 302 
predicated execution (谓词 执行 )，331-332，551 
defined (谓词 执行 的 定义 ) 332 
example (谓词 执行 的 示例 )，329 
use of (谓词 执行 的 使 用 )，332 
predication (谓词 )，331-332 
branching vs. 《分支 与 谓词 )，357 
processor use of (处 理 器 的 谓词 使 用 )，332 
predictive grammar ( MMX), 103, 105 
predictive parsers (预测 语法 分 析 器 ) 
cost of (预测 语法 分 析 器 的 代价 )，104 
DFAs vs. (DFA 与 预测 语法 分 析 器 的 比较 )，102 
importance (预测 语法 分 析 器 的 重要 性 )，106 
preorder walk (ai FF), 471 
priority (优先 级 ) 
backward list scheduling (向 后 列表 调度 的 优先 级 )，602 
computation (优先 级 计算 )，598 
forward list scheduling (向 前 列表 调度 的 优先 级 ) ， 
601-602 
ranking (优先 级 等 级 化 )，600 
schemes (优先 级 方案 )，599-600 
procedure abstraction (过 程 抽象 )，539 
procedure calls (过 程 调用 )，170，368-373 
data-flow analysis and (数据 流 分 析 和 过 程 调用 )，450 
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implementing (过 程 调用 的 实现 )，368 
imprecision (过 程 调用 的 非 精 确 性 )，483 
indirect costs (过 程 调 用 的 间接 代价 )，427-428 
leaf procedure optimizations ( 叶 过 程 优化 中 的 过 程 调 
用 )，372-373 
multiple sites (过 程 调 用 的 多 个 场所 )，368 
as optimization barrier (作为 优化 障碍 的 过 程 调用 )， 
427 
parameter evaluation (过 程 调用 的 参数 评估 )，369-370 
procedure-valued parameters (过 程 调 用 的 值 过 程 参 
数 )，370 
register save/restore (过 程 调 用 的 寄存 器 保存 或 恢复 )， 
370-372 
summary problems (过 程 调用 问题 小 结 )，484-485 
procedures (过 程 )，251-306 
arguments (过 程 的 参数 )，152 
called (调用 的 过 程 )，279，290 
defined (过 程 定义 )，251 
epilogue sequence (过 程 的 结语 序列 )，286，287 
functions (过 程 的 运行 )，253 
implicit arguments (过 程 的 隐 式 参数 )，370 
interface between (过 程 间 的 接口 )，251 
invoking (过 程 调用 )，152 
leaf ( 叶 过 程 )，372-373 
linkage (过 程 链 接 ) 286-290 
nested (WREKE), 257 
placement (过 程 的 放置 ) 540 
prologue sequence (过 程 的 序言 序列 )，286，287 
role (过 程 的 作用 )，252 
value communication between (过 程 间 的 值 传递 )， 
275-279 
Procedure-valued parameters ( 值 过 程 参 数 )，370 
productions (产生 式 )，78，79 
breaking, into two pieces (将 产生 式 分 成 两 部 分 )，192 
cost (PERRET), 560 
left-factoring (产生 式 的 左 因 式 分 解 )，101 
left-recursive 〈 产 生 式 的 左 递归 )，92 
required rules for (产生 式 所 需要 的 规则 )，182 
single symbol on right-hand side ( 右 端 为 单一 符号 的 
产生 式 )，143 
useless (无 用 产生 式 )，143 
profitability (425 ) . 
code optimization and ( 代码 优化 和 效益 )，390-391 
resource constraints and (资源 限制 和 效益 )，414 
programming languages ( 程序 设计 语言 /编程 语言 ) .See 
languages 


prologue sequences (序言 序列 )，286，287 
pruned SSA (BESSA), 468 
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random replacement (随机 置换 )，294 
range checking (范围 检测 )，343-344 
for array-valued parameters( 数组 值 参数 的 范围 检测 )， 
343 
defined (范围 检测 的 定义 ) 343 
run time code for (范围 检测 的 运行 时 代码 )，343 
reaching definitions (可 达 定 义 )，450-451 
computing (可 达 定 义 的 计算 )，456 
defined (可 达 定 义 的 定义 )，450-451 
as forward data-flow problem (作为 向 前 数据 流 问题 
的 可 达 定 义 )，451 
initial information gathering for (可 达 定 义 的 初始 定 
义 的 收集 )，451 
read-only memory (ROM) (只 读 存 储 器 )，23，539 
real numbers (实数 ) 
complexity (实数 的 复杂 性 )，39 
regular expression description of (实数 的 正则 表达 式 
的 描述 )，40 
real-time collectors (实时 回收 器 )，305 
receivers (接收 器 ) 
address (接收 器 地 址 )，370 
defined (接收 器 的 定义 )，271 
recognizers (识别 器 ) 
construction with scanner generator ( 带 有 扫描 器 生成 
器 的 识别 器 构建 )，65 
DFAs as (作为 识别 器 的 DFA )，60-61 
direct-coded (直接 编码 识别 器 )，64 
encoding, into table set (到 表 集 合 的 识别 器 编码 )， 
35-36 
implementing (识别 器 的 实现 )，34 
regular expression specifications (识别 器 的 正则 表达 
式 描述 )，36 
for unsigned integers (无 符号 整数 的 识别 器 )，34 
recompilation ( 重 编译 )，487-488 
analysis ( 重 编译 分 析 )，487-488 
dependences ( 重 编译 的 相关 性 )，488 
recursion (递归 ) 
associativity vs. (结合 性 与 递归 的 比较 )，205 
left ( 左 递归 )，94-96，138-140 
right ( 右 递归 )，95-96，138-140 
tail ( 尾 递 归 )，364 
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recursive programs (递归 程序 )，256 
recursive-descent parsers (递归 下 降 语 法 分 析 器 )，101- 


106 

code-space locality (递归 下 降 语法 分 析 器 代码 空间 的 
位 置 )，104 

construction strategy (递归 下 降 语 法 分 析 器 的 构造 策 
略 )，103 l 

error detection (递归 下 降 语法 分 析 器 的 错误 检测 )， 
104 

for expressions〈 表 达 式 的 递归 下 降 语法 分 析 器 ) ， 
105 

hand-constructed (手工 构造 的 递归 下 降 语 法 分 析 器 ) ， 
102, 143 

irreducible subgraphs (递归 下 降 语法 分 析 器 的 不 可 归 
约 子 图 )，483 . 

large grammar and (大 型 文法 和 递归 下 降 语法 分 析 
器 )，143 

for predictive grammar (预测 文法 的 递归 下 降 语 法 分 
析 器 )，103，105 

process automation (递归 下 降 语 法 分 析 器 过 程 的 自动 
化 )，104-106 


speed (递归 下 降 语法 分 析 器 的 速度 )，104 
structure (递归 下 降 语 法 分 析 器 的 结构 )，101 
See also top-down parsers 
recursive-descent parsing (递归 下 降 语 法 分 析 )，74 
reduce action ( 归 约 动作 )，117 
reduced expression grammar ( 归 约 表达 式 文法 )，146 
reduce-reduce conflicts ( 归 约 归 约 冲突 )，133，137 
reducible graphs (可 约 图 )，480 
redundancy (元 余 ) 
partial, converting ( 部 分 元 余 的 转换 ) ，507 
syntactic notion of ( 完 余 的 语法 表 记 法 )，418 
redundancy elimination (元 余 消除 ) 393-404, 523. 
with DAGs (使 用 DAG 的 宛 余 消除 ) 394-398 
global (全 局 宛 余 消除 ) 417-424 
lessons from (ERMER), 403-404 
useless code removal ( 宛 余 消除 的 无 用 代码 消除 )， 
498 
with value numbering (使 用 值 编号 的 元 余 消 除 )， 
398-403 
redundant expressions (元 余 表达 式 )，393-404 
detecting/eliminating (检测 或 消除 元 余 表 达 式 )，393 
names (元 余 表 达 式 的 名 字 )，419 
potential set representation (可 能 的 元 余 表 达 式 集合 
RR) 418 
at source level ( 源 代 码 级 的 元 余 表 达 式 )，393 
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reference counting (引用 计数 )，300-301 
arguments ( 引用 计数 的 讨论 ) 301 
cost (引用 计数 的 代价 )，301 
defined (引用 计数 的 定义 )，300 
problems (引用 计数 问题 )，300-301 
technique comparison (引用 计数 技术 比较 }，304 
See also garbage collection 
region constants (区 域 常量 )，529，530 
regional methods (区 域 方法 )，405-407 
analysis (区 域 方法 分 析 )，406 
focus (区 域 方法 的 焦点 )，406 
join points (区 域 方 法 中 的 连接 点 )，425 
superlocal methods vs. ( 超 局 部 方法 与 区 域 方法 的 比 
较 )，407 
See also optimization scope 
regional scheduling (区 域 调 度 )，605-613 ` 
algorithms (区 域 调度 算法)，605 
EBBs (EBB 上 的 区 域 调度 ) 605-607 
loops (区 域 调度 的 循环 ) 608-612 
trace (跟踪 区 域 调 度 ) 607-608 
See also instruction scheduling 
register allocation (寄存 器 分 配 ) 18-19, 619-658 
assignment vs. (赋值 与 寄存 器 分 配 ) 622-623 
background issues (寄存 器 分 配 的 背景 问题 ) 620- 
624 - 
defined (寄存 器 分 配 的 定义 )，545，619 
global (全 局 寄存 器 分 配 )，633-651 
harder problems in (寄存 器 分 配 中 的 难题 )，654-657 
instruction scheduling and (指令 调度 和 寄存 器 分 配 )， 
594 
instruction selection and (指令 篇 选 和 寄存 器 分 配 )， 
549 
local (局 部 寄存 器 分 配 )，624-629 
multiregister values and (多 寄存 器 值 和 寄存 器 分 配 )， 
649-650 
.NP-complete (寄存 器 分 配 中 的 NP 完全 )，622 
scope (寄存 器 分 配 的 作用 域 )，629 
specific placement (寄存 器 分 配 中 的 特定 放置 )， 
650-651 
register allocators (寄存 器 分 配器 )，316 
bad decisions in (寄存 器 分 配 中 的 不 好 的 决策 )，620 
bottom-up local ( 自 底 向 上 局 部 寄存 器 分 配器 )，626- 
629 
compiler decisions and (编译 器 的 决策 和 寄存 器 分 配 
52), 620 
concept (寄存 器 分 配器 的 概念 )，620 
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core functions (寄存 器 分 配器 的 核心 功能 )，594 
functioning of (寄存 器 分 配器 的 功能 )，620 
goal (寄存 器 分 配器 的 目标 )，633 
in memory-to-memory model (内 存 到 内 存 模 型 中 的 
寄存 器 分 配器 )，621 
for multiple blocks (多 个 块 的 寄存 器 分 配器 )，629- 
633 
in register-to-register model (寄存 器 到 寄存 器 模型 中 
的 寄存 器 分 配器 )，621 
for single blocks (单一 块 的 寄存 器 分 配器 ) 624-629 
specific register placement (寄存 器 分 配器 的 特定 寄 
存 器 放置 )，650-651 
spill code insertion (寄存 器 分 配器 的 游 出 代码 的 插 
A), 594 
top-down local ( 自 顶 向 下 局 部 寄存 器 分 配器 ) 625 
value relegation (寄存 器 分 配器 的 值 的 移交 )，619 
virtual name space mapping (寄存 器 分 配器 对 虚拟 名 
字 空 间 的 映射 )，594 
register assignment (寄存 器 赋值 )，594 
allocation vs. (寄存 器 赋值 与 分 配 的 比较 )，622-623 
defined (寄存 器 赋值 的 定义 )，622 
global (全 局 寄存 器 赋值 )，633-651 
local (局 部 寄存 器 赋值 )，624-629 
in polynomial time (多 项 式 时 间 内 的 寄存 器 赋值 )，622 
register classes 【寄存 器 分 类 )，623-624 . 
disjoint (不 相交 的 寄存 器 分 类 )，312 
physically/logically separate (物理 上 /逻辑 上 分 离 的 
寄存 器 分 类 )，623 
register pressure (寄存 器 压力 )，425 
register sets (寄存 器 集 ) 
clustered machine (组 群 寄存 器 集 的 机 器 )， 656 
partitioned (分 割 的 寄存 器 集 )，655-656 
registers (寄存 器 ) 
assigning, in priority order ( 按 优 先 度 顺序 指定 寄存 
器 )，625 
callee-saves (被 调用 者 存储 寄存 器 )，288，371 
caller-saves (调用 者 存储 寄存 器 )，371 
condition-code (条 件 代码 寄存 器 )，328，624 
demand，reducing( 减 小 寄存 器 需求 )，315-318 
demand for (对 寄存 器 的 需求 )，391 
floating-point (ABBE), 623 
general-purpose (通用 寄存 器 ) 546, 623 
keeping values in (把 值 保存 在 寄存 器 中 )，310-312 
memory vs. (内 存 与 寄存 器 的 比较 )，621 
minimizing number of (寄存 器 数量 的 最 小 化 )，19 
physical, demand for (对 物理 寄存 器 的 需求 )，623 


prealiocation (寄存 器 的 预 分 配 )，624 
predicate (谓词 寄 存 器 )，623-624 
promotion (寄存 器 提升 )，656 
refined specification, implementing (实现 寄存 器 细 
(CHR), 63 
reserving (保留 寄存 器 )，643 
‘restoring (恢复 寄存 器 ) 370-372 
saved values (已 保存 的 寄存 器 值 )，265 
saving (存储 寄存 器 )，288，370-372 
specific placement (寄存 器 的 特定 放置 )，650-651 
speed (寄存 器 的 速度 )，619 
virtual (虚拟 寄存 器 )，18，292，311，624 
register-to-register copy operations (寄存 器 到 寄存 器 的 
BAM), 665 
register-to-register model (寄存 器 到 寄存 器 模型 ) 235- 
236，292-293 
code shape and (代码 形态 和 寄存 器 到 寄存 器 模型 ) ， 
292-293，621 
operations (寄存 器 到 寄存 器 模型 的 操作 )，579 
register allocator in (寄存 器 到 寄存 器 模型 中 的 寄存 
器 分 配器 )，621 
See also memory models 
register-transfer language (RTL) (寄存 器 转换 语言 )， 
226, 579 
code interpretation (寄存 器 转换 语言 的 代码 解释 )，580 
defined (寄存 器 转换 语言 的 定义 )，579 
processing (寄存 器 转换 语言 的 处 理 )，580 
regular expressions (REs) (正则 表达 式 )，36-44 
alternation (正则 表达 式 的 选择 )，37 
closed (封闭 正则 表达 式 )，42 
closure (正则 表达 式 的 闭 包 )，38 
complexity( 正则 表达 式 的 复杂 性 )，42 
concatenation (正则 表达 式 的 连接 )，38 
construction from DFA (从 DFA 构 建 正 则 表达 式 )， 
59-60 
context-free grammars vs. (上 下 文 无 关 文 法 与 正则 表 
达 式 的 比较 ) 87-89 
defined (正则 表达 式 的 定义 )， 27，36 
deriving, from DFA (从 DFA 得 到 正则 表达 式 )，59 
deriving NFAs from (从 NFA 得 到 正则 表达 式 )，48 
examples (正则 表达 式 示 例 )，39-42 
finite automata and ( 有 穷 自 动机 和 正则 表达 式 )，36， 
44 
keywords (正则 表达 式 的 关键 字 ) 37 
language (正则 表达 式 语 言 )，37 
notation formalization ( 正则 表达 式 的 形式 化 表 记 法 )， 
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37-39 
operations (正则 表达 式 操作 )，37-38 
priorities (正则 表达 式 中 的 优先 级 )，61 
programming language (正则 表达 式 的 程序 设计 语 
言 ), 36 | 
properties (正则 表达 式 的 性 质 )，42-44 
real numbers description (实数 的 正则 表达 式 描述 )， 
40 . 
recognizer specifications ( 识别 器 的 正则 表达 式 描述 )， 
36 
regular languages (正则 表达 式 的 正则 语言 )，42 
for six-character identifiers (六 字符 标识 器 的 正则 表 
达 式 )，40 
for syntactic categories 〈 语 靶 范 畴 的 正则 表达 式 )，60 
in virtual life ( EWE PEER AER), 38 
widespread use of (正则 表达 式 的 广泛 使 用 )，71 
“zero or more occurrences,”( 正则 表达 式 的 “ 零 个 或 
多 个 出 现 ”) 37 
regular grammars (正则 文法 )，87，88 
defined (正则 文法 的 定义 )，88 
quadruple (四 元 组 正则 文法 )，87 
use (正则 文法 的 使 用 )，88 
regular languages (正则 语言 )，42 
rehashing (再 散 列 ) 691-693 
adding lexical scopes to (向 … 增 加 词法 作用 域 ) ， 
696-698 
defined (定义 再 散 列 )，686 
drawbacks (再 散 列 的 缺点 )，692 
table (再 散 列表 )，692 
table size (再 散 列 表 的 大 小 )，693 
relationals (关系 ) 322-333 
adding, to expression grammar (把 关系 操作 加 入 到 
表达 式 文法 中 ) ，323 
hardware support (关系 操作 的 硬件 支持 ) 328-332 
implementing (实现 关系 操作 )，329 
numerical encoding (编码 数字 关系 ) ，324-325 
positional encoding (编码 位 置 关系 )，325-327 
representations (关系 表示 )，323-328 
rematerialization ( 重 实现 )，654 
renaming ( 重 命名 ) 466-474 
algorithm ( 重 命名 算法 ) 466, 569 
avoiding antidependencies and (避免 反 相 关 性 和 重 命 
#), 595 
defined ( 重 命 名 的 定义 )，456 
dynamic register (动态 寄存 器 的 重 命名 )，604 
as enabling transformation 《作为 激活 转换 的 重 命 名 )， 


521-522 
example 〈 重 命名 的 示例 )，469-473 
register assignment and (寄存 器 赋值 和 重合 名)，594 
states (Br GAAS), 670-671 i 
as subtle issue 《作为 微妙 问题 的 重 命名 ) 522 
repeat until loop (repeat untji]1 循 环 )，112 
representations (表示 ) 
arbitrary graphs (任意 图 表示 )，682-684 
boolean ( 布尔 表示 )，323-328 
compactness (表示 的 简洁 性 )，677 
linear (线性 表示 )，225-228 
linked list (链表 表示 )，675 
list (列表 表示 )，675-677 
sparse-set (稀疏 集合 的 表示 )，678-679 
string ( RÆ), 344-345 
symbol table (符号 表 表 示 )，239 
representing sets (387544), 674-679 
as bit vectors 〈 作 为 位 向 量 的 表示 集合 ) 677 
as ordered lists〈 作 为 有 序列 表 的 表示 集合 ) 675- 
677 
sparse ( 稀 朴 的 表示 集合 )，678-679 
representing trees (表示 树 ) 680-681 
illustrated (图解 表 示 树 )，681 
methods (表示 树 方法 ) 680 
strengths/weaknesses (表示 树 的 优点 /缺点 ) 680-681 
resource (s) (资源 ) 
bounded machine, managing (管理 有 限 的 机 器 资源 )， 
497 
constraints (资源 限制 )，414 
restrict keyword (restrict 关 键 字 )，312 
retargetable compilers ( 可 重 定 目标 编译 器 ) 548-552 
building (构建 可 重 定 目标 编译 器 ) 548-552 
defined’ (可 重 定 目标 编译 器 的 定义 )，548 
exhaustive search and ( 穷 举 搜索 和 可 重 定 目标 编译 
器 )，582 
goal (可 重 定 目标 编译 器 的 目标 ) 549 
reverse dominance frontier 〈( 反 向 支配 边界 ) 500 
reverse postorder (RPO) ( 反 向 后 序 ) 
effectiveness ( 反 向 后 序 的 高 效 性 )，445 
for forward problem (前 驱 问 题 的 反 疝 后 序 )，446 
illustrated ( 图解 反 向 后 序 )，446 
impact on LiveOUT computation ( 反 向 后 序 对 
LiveOUT 计 算 的 影响 )，446 
rewrite rules ( 重 写 规则 )，559-565 
applying, to trees (把 重 写 规 则 运用 于 树 )，562 - 
contents ( 重 写 规则 的 内 容 )，559-560 
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defined 〈 重 写 规则 的 定义 ) 559 
illustrated ( 图 解 重 写 规 则 )，561 
nonterminal symbols ( 重 写 规则 中 的 非 终结 符号 ) ， 
560 
for tiling (铺盖 的 重 写 规则 )，561 
right associativity. ( 右 结合 性 )，139，140 
right context (右上 下 文 )，70，122 
right recursion (#4319), 95-96 
associativity ( 右 递 归 的 结合 性 )，139-140 
left recursion vs.( 左 递归 与 右 递归 的 比较 )，138-140 
stack depth ( 右 递 归 的 栈 深 度 )，138-139 
See also recursion 
right-recursive expression grammar ( 右 递 归 表 达 式 文法 )， 
97 
backtrack-free ( 右 递 归 表 达 式 文法 的 无 回溯 性 )，98 
right associativity ( 右 递归 表达 式 文法 的 右 结合 性 )， 
204-205 
stack depth ( 右 递 妇 表 达 式 文法 的 栈 深度 )，139 
RISC machines 《精简 指令 集 计 算 机 (RISC) 机 器 ) 
compiler simplicity and (编译 器 简化 和 RISC 机 器 )， 
579 
instruction selection and (指令 篇 选 和 RISC 机 器 )， 
579 
roots, dependence graph (依赖 图 的 根 )，589 
row-major order ( 行 优先 顺序 )，335-336 : 
address calculation( 行 优先 顺序 的 地 址 计算 )，338 
assignment statement ( 行 优先 顺序 中 的 赋值 语句 )， 


336 
indirection vectors in 〈 行 优先 顺序 中 的 间接 向 量 )， 
337 


layout ( 行 优先 顺序 布局 ) 335 

See also arrays 
rule-based evaluators - (基于 规则 的 评估 器 ) 188 
run-time environment (运行 时 环境 ) 13-14 
run-time heap.See heap 
run-time performance 〈 运 行 时 性 能 )，386，615 
run-time safety (运行 时 安全 性 )，155-156 
run-time tags (运行 时 标签 )，355 


S 


safety (安全 性 )，388-390 

defining (定义 安全 性 ) 389 

proving (证 明 安全 性 )，390 

run-time 《运行 时 安全 性 ) 155-156 
S-attributed grammars (S 属 性 文法 )，178，195 
scalar optimizations (标量 优化 )，491-544 


example (标量 优化 的 示例 )，498-523 
transformations 《标量 优化 的 转换 ) 494-497 
scalar replacement (标量 取代 )，656 
scanner generators. (扫描 器 生成 器 ) 
actions and (动作 和 扫描 器 生成 器 ) 66 
actions in accepting states ( 扫描 器 生成 器 的 接受 状态 
中 的 动作 )，65 
Tex (1ex 扫 描 器 生成 器 )，61 
for recognizer construction (扫描 器 生成 器 的 识别 器 
构造 )，65 
right context notation (扫描 器 生成 器 的 右上 下 文 记 
法 )，70 
tools (扫描 器 生成 器 工具 ) 61 
scanners (扫描 器 )， 
automatic generation illustration (扫描 器 的 自动 生成 
说 明 )，35 
construction ( 扫描 器 的 构造 )，28 
construction automation ( 扫描 器 的 自动 构造 )，35-36 
context-free grammars and (上 下 文 无 关 文 法 和 扫描 
#), 89 
with DFA, implementing ( 扫描 器 的 DFA 实 现 )，62 
direct-coded ( 扫描 器 的 直接 编译 ) 64 
for English (英语 扫描 器 )，43 
functioning of ( 扫描 器 的 功能 )，27 
high-quality (高 质量 扫描 器 )，39 
implementation simplification (简化 扫描 器 的 实现 )， 
35 
implementing (实现 扫描 器 ) 61-67 
overhead (扫描 器 的 开销 )，29 
PFC (PFC 扫 描 器 )，69 
for register names (寄存 器 名 的 扫描 器 )，62 
table-driven (扫描 器 的 表 驱 动 )，62-64 
two-pass (两 遍 扫 描 器 )，69-70 
use of (扫描 器 的 使 用 )，28 
well-implemented (优秀 的 扫描 器 )，29 
word categories (扫描 器 的 字 范 畴 )，66 
scanning (扫描 )，27-72 
context (上 下 文 扫描 )，69-70 
defined (扫描 的 定义 )，11 
FORTRAN (FORTRAN 扫 描 )，68 
parsing and (语法 分 析 和 扫描 )，73 
schedules (调度 ) 
backward jist scheduling (向 后 列表 调度 的 调度 )，602 
execution time (调度 的 执行 时 间 )，590 
iteratively selecting ( 选 代 地 选择 调度 )，596 
length (调度 长 度 )，590-591 
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register demand ( 调度 的 寄存 器 需求 ) 593 
time-optimal (时 间 优 化 调度 )，591，593 
well-formed (形式 良好 的 调度 )，590 
. scheduling (调度 ) 
algorithms (调度 算法 )，593 
defined (调度 的 定义 )，589 
difficulty (调度 的 困难 )，593 
EBBs (EBB 上 的 调度 )，605-607，608 
example (调度 的 示例 )，588 
fundamental operation in (调度 中 的 基本 操作 )，593 
instruction (指令 调度)，19-21，522，58S-618 
list〈 列 表 调 度 ) 593, 595-605 
loops (循环 调度 )，608-612 
regional (区 域 调度 )，605-613 
trace (跟踪 调度 )，607-608 
Scheme (Scheme) 
recursive program (Scheme 递归 程序 )，256 
scoping rules ( Scheme 作用 域 规则 )，261 
scoped value tables (作用 域 值 表 )，410 
scopes (作用 域 ) 
block, deleting (删除 块 作用 域 )，409 
current ( 当前 作用 域 ) ，244 
defined (作用 域 的 定义 )，256 
inheritance from (作用 域 的 继承 )，256 
labeling (作用 域 标签 )，242 
level (层次 作用 域 )，245 
lexical (词法 作用 域 ) 243, 694-698 
nested (REHM), 242-246, 257-259. 
optimization (优化 的 作用 域 ) 404-408 
in procedural languages (过 程 语 言 中 的 作用 域 )，257 
register allocation (作用 域 的 寄存 器 分 配 ) ，629 
transformation, increasing 《增加 作用 域 转换 ) 425 
scoping rules (作用 域 规则 )，257 
C (C 作 用 域 规则 )，259-260 
FORTRAN (FORTRAN 作 用 域 规则 )，259 
‘Java (Java 作 用 域 规则 ) ，261-262 
Scheme (Scheme 作用 域 规则 )，26T 
in various languages (各 语言 中 的 作用 域 规则 )，259- 
262 | 
semantic analysis (语义 分 析 )，12 
semantics (语义 ) 
checking (语义 检测 )，12 
defined (语义 的 定义 )，8 
syntax vs.《( 语 法 和 语义 的 比较 )，153 
semipruned SSA form ( 半 章 枝 SSA 形 式 )，457，468 
sentences (句子 ) 


constructing (构造 句子 ) 79-83 
deriving (获得 句子 )，75 
grammatical structure and (文法 结构 和 句子 )，81 
sentential form (名 型 ) 
defined ( 句 型 的 定义 ) 76 
obtaining (获得 句 型 )，77 
separate compilation (分 离 编 译 )，251 
shadow index variables (影子 索引 变量 )，362 
shift action (移入 动作 )，117 
shift operations ( 移 人 操作 ) 663-664 
shift-reduce parser (移入 归 约 语法 分 析 器 ) 190 
shift-reduce parsing 〈 移 和 人 归 约 语 法 分 析 )，108-112 
algorithm (A IAL RY), 112 
defined (移入 归 约 分 析 的 定义 )，109 
potential handles (移入 归 约 分 析 的 可 能 的 句柄 )，113 
shifts ( 移 人 归 约 分 析 的 移 位 )，112 
short-circuit evaluation (短路 评估 )，327-328 
boolean identities (短路 评估 布尔 等 式 )，327 
cost reduction (短路 评估 的 代价 减少 )，327 
defined (短路 评估 的 定义 )，327 
as optimization (作为 优化 的 短路 评估 )，330 
requirement (短路 评估 需求 )，330 
use of (短路 评估 的 使 用 )，328 
simulation clock (模拟 钟 )，597 
sinking (Fit), 539 
SLR(1) construction (SLR(1) 构 造 )，147 
snapshot tool (快照 工具 )，299 
source-level trees ( 源 代 码 级 树 )，217，218 
source-to-source translators ( 源 语言 到 源 语 言 翻 译 器 )， 
.2 
space (空间 )，23 
sparse conditional constant propagation (SCCP) (Mata 
件 常量 传播 )，524-526 
defined (稀疏 条 件 常量 传播 的 定义 )，524-525 
effectiveness ( 稀 醇 条 件 常 量 传播 的 有 效 性 )，527 
illustrated ( 图解 稀 疏 条 件 常 量 的 传播 ) 525 
initialization (稀疏 条 件 常量 传播 的 初始 化 ) 525-526 
lattice value ( 稀疏 条 件 常 量 传播 的 格 值 ) 526 
multiplies rules (稀疏 条 件 常 量 传播 中 的 多 条 规则 ) , 
527 . 
nonmonotonic behavior and (4E8047 4 AHA tF 
常量 传播 )，526 
power ( 稀 朴 条 件 常量 传播 的 威力 ) 527 
propagation (稀疏 条 件 常量 传播 的 传播 )，526 


` sparse simple constant propagation (SSCP) (稀疏 简单 常 


(ERB), 516-518 
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complexity (SSCP 的 复杂 性 )，516 
coverage (SSCP 的 覆盖 面 ) 517-518 
defined (SSCP 的 定义 )，516 
illustrated ( 图解 SSCP)，517 
lattice value assignment (SSCP 格 值 的 赋值 ) 524 | 
See also constant propagation 
sparse-set representation (稀疏 集合 表示 )，678-679 
defined (HR RA RARE), 678 
vectors requirement ( IRA 27a) RR), 
679 
specialization (H£), 515-518 
computation ( 特 化 计算 )，495-496 
constant propagation ( 特 化 的 常量 传播 )，515，516- 
518 
peephole optimization ( 特 化 的 罕 孔 优化 )，515 
tail-recursion elimination ( 特 化 的 尾 递归 消除 )，5$15 
speed (速度 )，23 
available expressions and ( 可 用 表达 式 和 速度 )，418 
memory operations (内 存 操 作 的 速度 )，547 
recursive-descent parsers (递归 下 降 语 法 分 析 器 的 速 
度 )，104 
registers (寄存 器 速度 )，619 
spill costs (溢出 代价 ) 
global, estimating (全 局 溢出 代价 ， 评 估 )，637-638 
infinite (无 限 溢 出 代价 )，638 l 
negative ( 负 溢 出 代价 )，638 
spill metric (溢出 度量 )，646 
spilling (HH) 
avoiding (避免 溢出 )，627 
clean values (净值 溢出 ) 628 
cost( 洲 出 代价 )，628 
defined (溢出 定义 )，620 
dirty values ( 非 净 值 溢 出 )，628，629 
floating-point registers 〈 浮 点 寄存 器 溢出 )，623 
global, cost estimation 〈 全 局 滋 出 代价 估 油 )，637- 
638 
interference-region 〔〈 区 域 冲 突 溢出 )，653 
live ranges and ( 活 范围 和 溢出 )，641 
partial live ranges ( 部 分 活 范 围 的 溢出 )，653 
predicate registers ( 谓词 寄存 器 的 溢出 )，623-624 
top-down coloring and ( 自 顶 向 下 着 色 和 溢出 ) 642- 
643 
splitting (分 离 ) 
live ranges (分 离 活 范围 ) 643 
nodes 《分离 结 点 ) 483 
partitions (分离 划分 )，57 


SSA graphs (SSA 图 )，524 
relating SSA to (关联 SSA 与 SSA 图 )，530 
transformed (转换 后 的 SSA 图 )，536 
See also static single-assignment (SSA) form 
stack allocation ( 栈 分 配 ) 
of activation records (活动 记录 的 栈 分 配 )，265-266 
advantages ( 栈 分 配 的 优点 )，266 
of dynamically sized array (动态 数组 的 栈 分 配 )，266 
symbol records (符号 记录 的 栈 分 配 )，694 
stack depth ( 栈 深度 )，138-139 
stack-machine code ( 栈 机 器 代码 )，224 
defined 〈 栈 机 器 代码 的 定义 ) ，223 
generation/execution ( 栈 机 器 代码 生成 /执行 )，224 
swap operation ( 栈 机 器 代码 的 swap 操 作 )，224 
See also linear IRs 
stack-relative notation ( 栈 相关 表 记 法 )，113 
start symbol (开始 符号 )，75，78 
static allocation (RDA), 267 
static analysis (静态 分 析 ) 
dynamic analysis vs. (语法 分 析 与 静态 分 析 的 比较 )， 
436 l 
over different scopes (不 同 作用 域 上 的 静态 分 析 ) 
434 
pointers and (指针 和 静态 分 析 )，449 
reasoning (静态 分 析 的 推理 )，433 
See also data-flow analysis 
static initialization (静态 初始 化 )，375 
static links (静态 链接 ) See access links 
static single-assignment (SSA) form (静态 单 赋值 形式 )， 
228-231, 454-479, 488 
build method (SSA 的 构建 方法 ) 456-457 
building (构建 SSA )，230 
building live ranges from (从 SSA 构 建 活 范围 )，636 
in code optimization (代码 优化 中 的 SSA ) 229 
data-flow analysis (SSA 的 数据 流 分 析 )，454-479 
defined (SSA 的 定义 )，228 
dominance (SSA 的 支配 ), :457-463 
encoding control flow into data flow (SSA 把 控制 流 编 
码 成 数据 流 ) 455 
example in (SSA 的 示例 )，410 
executable code reconstruction from (从 SSA 重 新 构建 
可 执行 代码 )，474-479 
loop (SSA 中 的 循环 )，229 
maximal ( 极 大 SSA)，457 
minimal ( 极 小 SSA),，468 
name space (SSA 的 名 字 空 间 ) 474, 475 
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names (SSA F), 455 
naming (命名 SSA )，233 
oddities (SSARUFE HE), 229-230 
program constraints (SSA 形 式 的 程序 的 限制 )，228 
properties (SSA 的 性 质 )，411 
pruned (前 枝 SSA)， 468 
rewriting ( 重 写 SSA), 475 
semipruned (#954), 457, 468 
in three-address IR (三 地 址 IR 的 SSA 形 式 )，230 
unique name (SSA 形 式 的 惟一 名 字 )，454 
See also SSA graphs 
static variables (静态 变量 ) 
access to (静态 变量 的 存 取 )，280 
combining (组 合 静态 变量 )，281 
data areas (数据 区 内 的 静态 变量 )，290-291，310 
statically checked languages (静态 检测 语言 )，169 
statically typed languages (静态 类 型 语言 )，156，169 
static-distance coordinate ( 静 距 离 坐 标 )，281 
stop and copy collectors (停机 拷贝 回收 器 )，303 
Storage layouts, array (数组 的 存储 布局 ) 335-337 
storage locations (存储 位 置 ) 
array elements (数组 元 素 的 存储 位 置 )，337 
assigning (指定 存储 位 置 )，309-313 
assigning ，to declared variables (指定 已 声明 变量 的 
存储 位 置 )，202 
choice of (存储 位 置 的 选择 )，13 
store operation (store 操作 )，346，347，601，612， 
665 ~ 
straight condition codes (直线 条 件 代 码 )，328-330 
strength reduction (强度 削弱 )，527-538 
algorithm (强度 削弱 算法 )，532-533 
background ( 强度 前 弱 背 景 )，529-532 
defined (强度 削弱 定义 )}，527-528 
example illustration (强度 前 弱 示 例 说 明 )，528 
linear-function test replacement ( 强度 削弱 中 的 线性 
国 数 测试 替换 ) 537-538 
rewriting algorithm (强度 削弱 中 的 重 写 算法 ) 534- 
535 
string assignment (HBA), 345-349 
concept (HHA), 345 
with whole-word operators (使 用 全 字 操 作 的 串 赋值 )， 
348 
string (s) ($), 163, 344-350 
arrays vs. (数组 和 串 的 比较 ) 163 
as collection of symbols ( 作为 符号 集合 的 串 ) 76 
concatenation (连接 串 ) 349 
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as constructed type (作为 结构 类 型 的 串 ) 163 
index (#531), 66 
length (KÆ), 350 
manipulation overhead 〔〈 串 处 理 的 开销 )，66-67 
null-terminated (〈 串 的 空 终 止 )，346，349 
operations ( EHRE), 344 
overlapping (#24), 212 
quoted character (被 引用 字符 串 ) 40 
representations ( 串 表 示 )，66，344-345 
sentential form 〈 串 名 型 )，76，77 
sets of (BHA), 37 
strongly checked implementation ( 强 检测 实现 )，169 
strongly typed languages 〈 强 类 型 语言 )，156，159 
structural data-flow algorithms (结构 数据 流 算 半 )，480- 
483 
structural equivalence (结构 等 价 )，166，167 
structure layouts (结构 布局 )，350 
illustrated (说 明 结 构 布 局 )，353 
multiple copies of (结构 布局 的 多 重 找 风 )，353-354 
understanding (结构 布局 的 理解 )，352-355 
unused space (结构 布局 的 未 使 用 空间 )，353 
user exposure (对 用 户 公开 的 结构 布局 )，353 
structure references (结构 引用 )}，350-355 
anonymous values (结构 引用 中 的 匿名 值 ) 351-352 
arrays of structures (结构 引用 中 的 结构 数组 ) 353, 
354 
code emission for (为 结构 引用 的 代码 发 行 )，352 
structure layouts (结构 引用 的 结构 布局 )， 352-353 
structures (结构 ) 
alternative view (结构 的 另 一 种 观点 )，164 
defined (结构 的 定义 )，164 
as distinct types (作为 不 同类 型 的 结构 )，164 
type of (结构 的 类 型 )，165 
variants and (变量 和 结构 )，164-165 
subset construction ( 子 集 构造 法 )，51-55 
e-closure offline computation ( 子 集 构造 法 的 s- 闭 包 
脱 机 计算 )，55 
algorithm steps ( 子 集 构 造 法 算法 步 申 ) 54 
applying, toDFA (把 子 集 构造 法 运用 于 DFA )，53 
defined ( 子 集 构造 法 的 定义 )，51 
DFFA from ( 子 集 构造 法 的 DFFA)，55-56 
example ( 子 集 构造 法 的 例子 )，52-54 
fixed-point computations ( 子 集 构造 法 不 动 点 计算 )， 
54 
illustrated ( 子 集 构造 法 的 说 明 )，51 
subtrees evaluation order ( 子 集 构 造 法 的 子 树 评估 顺序 )，318 
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superclasses (#§2&), 271 

superlocal methods ( 超 局 部 方法 ) 405 
defined ( 超 局 部 方法 的 定义 )，405 
regional methods vs. ( 超 局 部 方法 与 区 域 方 法 的 比 

较 )，407 

superlocal value numbering ( 超 局 部 值 编号 ) 408-413 
defined ( 超 局 部 值 编号 的 定义 )，411 
effectiveness ( 超 局 部 值 编号 的 效率 )，412-413 
example ( 超 局 部 值 编号 的 示例 )，411-413 
results ( 超 局 部 值 编号 的 结果 )，412 
scope creation ( 超 局 部 值 编 号 的 作用 域 创建 ) 412 
See also value numbering 

superscalar processors (超标 量 处 理 器 )，586，587 
operation determination (超标 量 处 理 器 的 操作 决策 )， 


586 
two-unit, executing (两 功能 单位 超标 量 处 理 器 的 执 
行 )，610 


swap problem (交换 问题 ) 478-479 
defined (交换 问题 的 定义 )，475 
example illustration (交换 问题 的 示例 说 明 )，478 
set of @-functions (交换 问题 中 的 9 函数 集合 )，479 
switch statement (switch 语 句 )，308，309 
symbol records (符号 记录 ) 
stack allocation 〈 符 号 记录 栈 分 配 ) 694 
storing (符号 记录 存储 ) 693-694 
symbol tables (符号 表 )，238-248 ，701 
building (构建 符号 表 ) 241-242 
as central repository (作为 中 心 库 的 符号 表 )，698 
defined (符号 表 的 定义 )，193 
dependent-type fields (符号 表 中 的 类 型 相关 域 )，193 
flexible design (符号 表 的 巧妙 设计 )，698-700 
hash 〈 散 列 符 号 表 )，239-241 
index (索引 符号 表 )，241 
interface routines (符号 表 接 口 例 程 )，241-242 
linked (链接 符号 表 )，248 
multiset discrimination for (符号 表 中 多 重 级 判别 )， 
241 l 
organizing (符号 表 组 织 )，687 
representation (符号 表 表 示 )，239 
role (符号 的 作用 )，701 
scoped (作用 域 符号 表 )，242-246 
selector (篇 选 器 符号 表 )，247 
separate (分 离 表 )，247 
unified (统一 表 )，247 
uses (符号 表 使 用 )，246-248 
symbolic simplifier (符号 简化 器 )，581 


symbols (符号 ) 
current input (当前 输入 符号 )，92 
designated (特定 的 当前 符号 )，109 
eof (eof 符 号 )，121 
goal (目标 符号 )，75，78，79，120 
nonterminal ( 非 终 结 符号 )，75,，76, 78, 560, 563 
start (开始 符号 )，78 
terminal (终结 符号 )，75，76,，78，93 
syntactic categories (语法 范畴 ) 29 
of highest-priority pattern (最 高 优先 级 模式 的 语法 范 
RE), 61 
regular expressions for (语法 范畴 的 正则 表达 式 )，60 
syntax 《语法 ) 
checking (语法 检测 )，9-11 
correctness (语法 的 正确 性 )，12 
declaration ( W ÆHH), 199, 200 
defined (语法 定义 ) 8 
errors (语法 错误 )，110，134 
expressing (表示 语法 )，74-89 
meaning vs. (意义 与 语法 的 比较 )，153 
microsyntax separation from (从 语法 中 分 离 的 微 语 
法 )，28-29 
recognizing 《识别 语法 )，73 
specification-based approach (基于 描述 的 语法 )，10 
syntax-related trees ( 与 语法 相关 树 )，213-218 
abstract syntax trees (ASTs) (与 语法 相关 树 中 的 抽象 
语法 树 )，214-215 
abstraction level (与 语法 相关 树 的 抽象 层次 ),. 217-218 
directed acyclic graph (与 语法 相关 树 中 的 有 向 无 环 
图 )，216-217 
low-level (低级 与 语法 相关 树 )，218 
parse trees (与 语法 相关 树 中 的 分 析 树 ) 213-214 
source-level ( 源 语言 级 与 语法 相关 树 ) 217, 218 
synthesized attributes (合成 属性 )，173 


T 


table-driven scanners ( 表 驱 动 扫 描 器 )， 62-64 
table-filling algorithm ( 表 填 充 算法 )，128 
grammar ambiguity and (文法 的 歧义 性 和 表 填 充 算 
法 )，132 
LR(1) (LR(1) 表 填充 算法 )，128 
tables (表格 ) 
generating, from DFA description (从 DEFA 描 《 述 生 成 
表格 )，63 
hash (〈 散 列表 )，239-241 
LR(1) (LR(1) 表 格 )，120-133 
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structure (#8432), 247-248 . 
symbol (434%), 193, 238-248 
tail calls ( 尾 调 用 表 )，364 
tail-recursion ( 尾 递 归 ) 
defined ( 尾 递归 定义 ) ，364 
elimination 〈 尾 递归 消除 )，515 
programs ( 尾 递 归程 序 ) 615-616 
tbl operation (tb1 操 作 )，440，670 
terminal symbols (终结 符号 )，76，93 
Action table (Action 表 格 中 的 终结 符号 )，144 
arrayed (排列 的 终结 符号 )，104 
defined (终结 符号 的 定义 )，75 
removing (消除 终结 符 )，145 
set of (终结 符号 的 集合 )，78 
Thompson’s construction (Thompson 构 造 法 )，48-50 
applying (运用 Thompson 构 造 法 )，50 
aib pattern (Thompson 构造 法 中 的 atb 模 式 )，61 
defined (Thompson 构 造 法 的 定义 )，48 
NFAs derived from (从 Thompson 构 造 法 得 到 NFA ), 
49, 51 
properties dependence (Thompson 构 造 法 的 性 质 依 
i), 49 
three-address code (三 地 址 代码 )}，224-225 
benefits (三 地 址 代码 的 好 处 ) 225 
defined (三 地 址 代码 的 定义 ) 223 
implementations 《三 地 址 代码 的 实现 ) 227 
operations (三 地 址 代码 的 操作 )，224-225 
as quadruples ( 作为 四 元 组 的 三 地 址 代码 ) 226 
SSA form in (三 地 址 代码 中 的 SSA 形 式 )，230 
See also linear IRs , 
three-phase compilers (三 阶段 编译 器 )，6 
thunks ( 形 实 转换 ) 277 
tiling (8%), 559 
for AST (AST 的 铺盖 ) ，564 
costs (铺盖 代价 )，568 
defined (铺盖 定义 )，559 
finding (寻找 铺盖 )，565-568 
goal (铺盖 目标 )，566 
implementation (实现 铺盖 )，559 
locally optimal (局 部 优化 的 铺盖 )，568 
rewrite rules for (铺盖 的 重 写 规则 )，561 
selection (选择 铺盖 ) 564 
time-optimal schedules (时 间 优 化 调度 )，591，593 
top-down coloring ( 自 顶 向 下 着 色 )，642-643 
defined ( 自 顶 向 下 着 色 的 定义 )，642 
live range splitting ( 自 顶 向 下 着 色 的 活 范 围 的 分 割 )， 
643 
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priority ranking ( 自 预 向 下 着 色 的 优先 级 等 级 )，649 
spill handling ( 自 顶 向 下 着 色 的 溢出 处 理 )，642-643 
spill-and-iterate philosophy ( 自 顶 向 下 着 色 的 谥 出 迭 
代 哲 学 )，648 
See also global register allocation 
top-down local register allocation 〈 自 顶 向 下 局 部 寄存 器 
分 配 ) ，625 
top-down parsers ( 自 顶 向 下 语法 分 析 器 ) 89-106 
defined ( 自 顶 向 下 语法 分 析 器 的 定义 ) 86-87 
efficient (高 效 的 自 顶 向 下 语法 分 析 器 )，108 
expansion forever( 自 顶 向 下 语法 分 析 器 的 永远 展开 )， 
92 
functioning of ( 自 顶 向 下 语法 分 析 器 的 功能 )，89-90 
recursive-descent (递归 下 降 自 顶 向 下 语法 分 析 器 )， 
101-106 
See also parsers; parsing 
top-down parsing ( Å Mia Fikar), 89-106 
algorithm ( 自 顶 向 下 语法 分 析 的 算法 )，91 
backtrack elimination ( 自 顶 向 下 语法 分 析 的 回溯 消 
BR), 97-101 
complications ( 自 顶 向 下 语法 分 析 的 复杂 性 )，94 
example ( 自 顶 向 下 语法 分 析 的 示例 )，90-93 
left recursion elimination ( 自 顶 向 下 语法 分 析 的 左 递 
归 消 除 )，94-96 
trace scheduling (跟踪 调度 ) 607-608 
defined (跟踪 调度 的 定义 ) 607 
` EBB scheduling and (EBB 调 度 和 跟踪 调度 ) 608 
procedure schedule (跟踪 调度 的 过 程 调度 )，608 
trampoline function (蹦床 函数 )，379-380 
class-specific (类 特定 蹦床 函数 )，380 
defined (蹦床 函数 的 定义 )，379 
multiple inheritance with ( 使 用 蹦床 函数 的 多 重 继承 )， 
380 
transformations (转换 )，16 
enabling (激活 转换 )，496，518-S22 
left-factoring (转换 的 左 因 式 分 解 )，101 
machine-independent (机 器 无 关 的 转换 )，494-496， 
496-497 
scope, increasing (增加 转换 的 作用 域 )，425 
strength reduction (转换 的 强度 前 弱 )，527-538 
taxonomy for (转换 的 分 类 )，494-497 
transition diagrams (转换 图 ) 
as code abstractions (作为 代码 抽象 的 转换 图 )，31 
DFA (DFA 转 换 图 )，59 
quintuple equivalency (转换 图 的 四 元 组 等 价 )，32 
tree patterns ( 树 神 式 )，566 
context capture ( 树 模式 的 上 下 文 刻 画 )，562 
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as grammar rules (作为 文法 规则 的 树 模 式 )，563 
working with (使 用 树 模式 )，558 
tree-pattern matching ( 树 模式 匹配 ) 551, 558-569 
cost computation (计算 树 模式 匹配 的 代价 ) ，568 
instruction selection via (通过 树 模式 匹配 实现 指令 筛 
选 )，558-569 
on quads (四 元 组 上 的 树 模式 匹配 )，571 
process, speeding up (加 速 树 模式 匹配 过 程 )，567 
rewrite rules ( 树 模 式 匹 配 的 重 写 规则 )，559-565 
tools( 树 模式 匹配 工具 )，568-569 
trees (Ht) 
abstract syntax (ASTS) (抽象 语法 树 )，139，196-197 ， 
217-218, 556, 559 
attributed parse ( 属性 分 析 树 ) 172, 174, 187 
binary ( 二叉树 )，681-682 
dominator (支配 者 树 )，416，458，459，474 
implementation, simplifying ( 简化 树 的 实现 )，682 
low-level (低级 树 )，218 
mapping (映射 树 )，681-682 
operation ( 树 操作 )，559，563 
parse (分 析 树 )，81，83，172，186-187，213-214 
representing (HIRR), 680-681 
source-level ( 源 语言 级 树 )，217，218 
syntax-related ( 与 语法 相关 树 )，213-218 
tree-walk ( 树 遍 历 )，552-5S8 
code generator ( 树 遍历 的 代码 生成 器 ) 318, 562 
for expressions (表达 式 树 遍 历 ) 314 
for instruction selection (指令 筛选 树 志 有 历 ) 552-558 
recursive routine (递归 树 遍历 历程 )，315 
scheme (he A), 552-558 
trivial base addresses (平凡 基地 址 )，280-281 
two-dimensional hash tables ( 一 维 散 列表 ) 698-699 
defined ( 二 维 散 列表 定义 )，699 
illustrated (二 维 散 列表 说 明 )，699 
two-pass scanners (两 遍 扫 描 器 )，69-70 
first pass 《两 过 扫描 器 的 第 一 遍 )，69 
second pass (两 遍 扫 描 器 的 第 二 遍 )，69 
type checking (类 型 检测 ) 159-160 
at compile time (编译 时 类 型 检测 )，159 
declarations and (声明 和 类 型 检测 )，203 
deferring (类 型 检测 的 延迟 )，171 
defined (类 型 检测 的 定义 )，159 
type equivalence (类 型 等 价 )，166-167 
name (名 字 类 型 等 价 )，166，167 
structural (结构 式 等 价 )，166, 167 
type inference (类 型 推断 )，155-156 
accurate (精确 的 类 型 推断 )，171 
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ad hoc framework for (类 型 推断 的 专用 框架 )，195 
for expressions (表达 式 的 类 型 推断 ) ，168-170，195 
harder problems ( 类 型 推断 中 的 较 难 的 问题 ) 202- 
204 
interprocedural aspects of (类 型 推断 中 过 程 间 的 相关 
问题 )，170-171 
rules (类 型 推断 的 规则 )，167-168 
successful (成 功 的 类 型 推断 )，204 
type signatures (类 型 署名 ) 
defined (类 型 署名 的 定义 )，170 
in symbol tables (符号 表 中 的 类 型 署名 )，193 
type systems (类 型 系统 )，154-171 
base types (类 型 系统 中 的 基本 类 型 )，160-161 
better code generation (生成 较 好 代码 的 类 型 系统 )， 
157-159 
classifying (类 型 系统 的 分 类 )，169 
components (类 型 系统 的 组 成 部 分 )，160-171 
compound/constructed types (混合 类 型 系统 /结构 类 
型 系统 )，162-166 
defined (类 型 系统 的 定义 )，154 
expressiveness (类 型 系统 的 表示 能 力 )，156-157 
inference rules (类 型 系统 的 推断 规则 )，167-168 
purpose of (类 型 系统 的 目的 )，154-160 
run-time safety (运行 时 安全 的 类 型 系统 )，155-156 
secondary vocabulary. (次 要 词汇 表 的 类 型 系统 )， 
154 
theory (类 型 系统 理论 )，160 
type equivalence (类 型 等 价 的 类 型 系统 )，166-167 
well-constructed (结构 良好 的 类 型 系统 )，156 
well-designed (设计 良好 的 类 型 系统 )，157 
See also context-sensitive analysis 
type-consistent uses (类 型 相 容 运用 )，203-204 
constant function types and (常量 函数 类 型 和 类 型 相 
容 运 用 )，203 
unknown function types and (未 知 国 数 类 型 和 类 型 相 
容 运 用 )，203-204 
type(s) (类 型 ) 
base (基本 类 型 ) 160-161 
cell (单元 类 型 ) 156 
compound (混合 类 型 ) 162-166 
constant function (常量 函数 类 型 )，203 
constructed 〈 结 构 类 型 ) 162-166 
declared (声明 的 类 型 )，168 
defined (类 型 定义 )，154 . 
determination at compile time (编译 时 类 型 决策 )，157 
dynamic changes in (类 型 中 的 动态 变化 )，204 
enumerated ( 枚 举 类 型 )，163-164 
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errors (类 型 错误 )，167-168 : 

Fortran result (Fortran 中 的 结果 类 型 )，155 

representing ( 类 型 表示 )，167 

return (返回 类 型 ) 203 

specification (类 型 描述 ) 154 

unknown function (#414 Bi), 203-204 - 
typing rules (类 型 规则 )，203 


U 


unambiguous values ( 非 歧 义 性 值 )，312 
unary operators (一 元 操作 符 )，135-136，320 
absolute value (绝对 值 一 元 操作 符 )，135 
adding (加 入 一 元 操作 符 )，、135 
types of (一 元 操作 符 的 类 型 )，135 
See also operators 
unions (联合 )，354-355 
element references (联合 中 的 元 素 引 用 ) ，355 
multiple structure definitions (联合 中 的 多 重 结 构 定 
3), 354 
universal hash functions (通用 散 列 函 数 ) 688 
unknown function types (未 知 函 数 类 型 ) 203-204 
unreachable code (不 可 达 代码 ) 
defined 〈 不 可 达 代码 的 定义 ) 498 
eliminating (不 可 达 代 码 的 消除 )，505 
See also useless code elimination 
unrolling loops (循环 展开 )，390，391 
unsigned integers (无 符号 整数 ) 
description (无 符号 整数 的 描述 )，39 
finite automata for (无 符号 整数 的 有 穷 自动 机 )，37 
recognizer for (无 符号 整数 的 识别 器 )，34 
until loops (unti1 循 环 )，363 
untyped languages (无 类 型 语言 )，156，159 
upper frontier ( 上 边界 ) 107 
‘Use points (使 用 点 )，221 
useless code (无 用 代码 )，498 
useless code elimination (无 用 代码 消除 )，495，498- 
505 | o 
algorithm 〈 无 用 代码 消除 算法 ) 499-501 . 
control dependencies definition (无 用 代码 消除 中 的 控 
制 相关 定义 )，499 
control flow (无 用 代码 消除 中 的 控制 流 )，501-505 
illustrated {无 用 代码 消除 的 图 解 )，500 
passes (无 用 代码 消除 的 遍 )，499 
redundancy elimination and (元 余 消 除 和 无 用 代码 消 
除 )，498 l 
useless control flow elimination (无 用 控制 流 消 除 )， 
501-505 


block combining (无 用 控制 流 消除 中 块 结合 )，502 
branch hoisting (无 用 控制 流 消除 中 分 支 提 升 )，502 
empty block removal (无 用 控制 流 消除 中 的 空 块 消 
除 )，501 
redundant branch folding (无 用 控制 流 消除 中 的 宛 余 
分 支 的 登入 )，501 
useless productions (无 用 产生 式 ) 143 
user-defined types (用 户 定义 类 型 )，320 


V 


validation passes (确认 遍 )，674 
value numbering ( 值 编号 )，398-403 
algorithm ( 值 编号 算法 ) 398-399 
algorithm extension ( 值 编号 算法 的 扩展 )，400-402 
basis ( 值 编号 的 倾向 )，398 
code transformation〈 值 编号 中 的 代码 转换 ) 403- 
404 
for commutative operations (可 交换 操作 的 值 编 号 )， 
400 
cost ( 值 编号 的 代价 )，408 
defined ( 值 编号 的 定义 )，398 
dominator-based (基于 支配 者 的 值 编 号 )，413-417 
example ( 值 编号 示例 )，399 
with extensions (使 用 扩展 的 值 编号 )，401 
local (局 部 值 编号 )，474 
naming and (命名 和 值 编号 )，402-403 
opportunity discovery ( 值 编号 中 的 机 会 发 现 )，403 
over regions larger than basic blocks (大 于 基本 块 区 
域 上 的 值 编号 )，408-417 
scope increase and (作用 域 增加 和 值 编号 )，414 
scope of optimization differences (优化 作用 域 不 同 的 
值 编号 )，541 
superlocal ( 超 局 部 值 编 号 )，408-413 
values ( 值 ) 
ambiguous (歧义 性 值 )，312，656-657 
anonymous (匿名 值 )，3$0，351-352 
boolean (布尔 值 )，322 
clean (净值 )，628 
dead (死亡 值 )，575-576 
- dirty ( 非 净 值 )，628，629 
initializing 〈 值 的 初始 化 )，200 
keeping, in register (把 值 保存 于 寄存 器 中 )，310- 
312 è 
lifetimes 〈 值 的 生存 期 )，310 
mapping, to names (〈 值 到 名 字 的 映射 )，231-238 
memory-resident (内 存 居住 值 )，313 
multiregister ( 多 寄存 器 值 ) 649-650 
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name choice ( 值 的 名 字 选 择 ) 402 
named (命名 的 值 )，309 
naming ( 值 命 名 )，191-192 
parameter, accessing ( 存 取 参 数值 ) 318-319 
pointer ( 指针 值 ) 350, 352 
position ( 值 位 置 )，241 
returning ( 值 返回 ) 279 
spilling ( 值 溢出 )，620 
stack-based (基于 栈 的 值 )，191 
temporary, naming (临时 值 命名 )，233-235 
unambiguous ( 非 歧 义 性 值 ) 312 
unnamed (未 命名 的 值 )，309 
virtual register assignment (虚拟 寄存 器 的 赋值 )，311 
variables (变量 ) 
class (3845), 262, 271, 380 
dead {死亡 变量 )，575 
different-sized representations (不 同 大 小 表示 的 变 
量 )，554 
free (自由 变量 )，261 
global (全 局 变量 )，280，281，290-291 
induction (归纳 变量 ) 529, 530, 531, 532 
initializing (变量 初始 化 )，264-265 
instance (变量 实例 )，270 
live (EE), 435-444 
local (局 部 变量 )，264，281-285 
memory layout (变量 的 内 存 布局 ) 293 
name choice (变量 名 选择 ) ，402 
pointer-based (基于 的 指针 的 变量 )，449 
shadow index (影子 索引 变量 ) 362 
static (静态 变量 ) 280, 290-291 
storage classes (存储 类 变量 ) 554 
vectors (向 量 ) 
adjacency ( 邻接 向 量 ) ，684 
“bit (位 向 量 )，677 
characteristic (特征 向 量 )，677 
defined (向 量 的 定义 )，333 
dope (内 情 向 量 )，342-343 
elements, referencing (向 量 元 素 的 引用 )，333-335 
indirection (间接 向 量 )，335，336-337 
lower/upper bounds (向 量 的 下 界 / 上 界 )，333 
memory layout (向 量 的 内 存 布局 ) 333 
systematic addressing (向 量 系 统 寻 址 )，336 
See also arrays 
very busy expressions (非常 忙碌 表达 式 )，451-452 
Very-long instruction word (VLIW) machines ( 超 长 指令 
字 机 器 )，586 


packed (压缩 的 VLIW )，587 
scheduler (VLIW 机 器 的 调度 器 )，587 
virtual functions ( 虚 函 数 )，392 
Virtual registers (虚拟 寄存 器 )，18，292 
defined (虚拟 寄存 器 的 定义 )，624 
feasible ( 可行 的 虚拟 寄存 器 ) 625 
number of ( 虚拟 寄存 器 的 数量 ) 624 
priority computation for (虚拟 寄存 器 的 优先 级 计算 )， 
625 
single (单一 虚拟 寄存 器 )，629 
sorting (分 类 虚拟 寄存 器 ) 625 
value assignment ( 虚拟 寄存 器 的 值 赋值 )，311 
See also register allocation; registers 
volatile keyword (volatile), 312 


W 


weakly typed languages，( 弱 类 型 语言 ) 156 
weakly-checked implementation, ( 弱 检查 实现 ) 169 


while loops (wht1e 循 环 )，34，5$2，54，302 


in case statement ( 选择 语句 中 的 whi1e 循 环 )，367 
code (while 循环 代码 )，363 
implementation (whi1e 循 环 实现 )，363 
iteration (wh11e 循 环 达 代 )，$4，125 
splitting sets (wh1i1e 循 环 分 离 集 合 )，59 
See also loops 
whole-program allocation (整个 程序 分 配 )， 654-655 
parameter-binding mechanisms and (参数 绑 定 机 制 和 
整个 程序 分 配 ) 655 
performing (执行 整个 程序 分 配 ) 655 
potential ( 整个 程序 分 配 潜能 ) 654 
whole-program methods (整个 程序 方法 )， 407-408 
words ( 字 ) 
categories ( 字 范 畴 ) ，66 
character-by-character formulation ( 按 字符 识别 字 公 
式 )，29-33 
complex, recognizing (复杂 字 的 识别 )，33-35 
lexical structure of ( 字 的 词法 结构 )，35 
in programming languages (程序 设计 语言 中 的 字 )， 43 
recognizing (识别 字 )，29-36 
scanner recognition of ( 字 的 扫描 器 识别 )，28 
syntactic categories ( 字 的 语法 范畴 ) 29 


Z 


zero-cost splitting ( 零 代价 分 割 )，653 


